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(57) Abstract 

A DNA fragment coding for a modified nuclear glucocorticoid receptor, particularly one mutated in the region coding for the ligand 
binding domain, so that receptor activity is more strongly inducible by a synthetic glucocorticoid ligand than by a natural glucocorticoid 
ligand, is disclosed. A recombination system inducible in mammals by means of a fusion protein produced between a recombinase and 
the binding domain of the ligand derived from the modified glucocorticoid receptor of which the activity is more strongly inducible by 
synthetic glucocorticoids than by natural glucocorticoids, is also disclosed. 

(57) Abrlge' 

La prgsente invention conceme un fragment d'ADN codant pour un recepteur nucleaire de glucocorticoids modi 66, notamment mute" 
dans la region codant pour le domaine de liaison du ligand, de sorte que l'activite* dud it recepteur est inductible plus fortement par un 
ligand glucocorticoide synthltique que par un ligand glucocorticoYde nature!. La prlsente invention concerne 6galement un systeme de 
recombinaison inductible chez les marnmiferes, grace a V utilisation d'une proline de fusion rtalisee entre une recombinase, et le domaine 
de liaison du ligand, derive* du recepteur des glucocorticoifdes modifie\ dont Pactivite" est plus fortement inductible par des glucocorticoides 
synth6tiques, que par des glucocorticoKdes naturels. 
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RECEPTEUR NUCLEAIRE DE GLUCOCORTICOIDES MODIFIE, PROTEINE DE FUSION, 
FRAGMENTS D'ADN CODANT POUR LEDIT RECEPTEUR ET LAOITE PROTEINE DE FUSION 



La presente invention concerne un fragment d'ADN codant pour un 
recepteur nucleaire de glucocorticoides (GR) modifie, et un fragment 
d'ADN codant pour un domaine de liaison du ligand (LBD) dudit recepteur, 
ainsi qu'un fragment d'ADN codant pour une proteine de fusion 
comportant ledit recepteur ou ledit domaine de liaison du ligand dudit 
recepteur fusionne a une proline dont l'activite est induite en presence 
de ligands glucocorticoides. 

La presente invention concerne egalement un recepteur nucleaire 
de glucocorticoides modifie, notammcnt le recepteur humain et son 
domaine de liaison du ligand modifie, ainsi qu'une proteine de fusion 
comportant ledit recepteur ou ledit domaine de liaison du ligand. 

La presente invention concerne egalement un vecteur d'expression 
conditionnelle d'une proteine, notamment une proteine etrangere dans 
des cellules hotes humaines ou animales, notamment des cellules de 
mammiferes. La presente invention se rapporte aussi k un proc6d6 
d'expression d'une proteine dans lesdites cellules. Par ailleurs, la presente 
invention concerne un procede d'excision, insertion, inversion, ou 
translocation conditionnelle d'un fragment d'ADN dans des cellules hdtes 
humaines ou animales, notamment de mammiferes. 

La presente invention concerne en outre un vecteur de transfert 
d'un fragment d'ADN dans lesdites cellules hotes humaines ou animales, 
notamment de mammiferes, et son utilisation comme medicament, comme 
outil d'analyse et etude du fonctionnement d'un gene ainsi qu'une 
methode de traitement de cellules ex vivo ou in vitro. 

Enfin, la presente invention concerne les cellules humaines ou 
animales transfectees par un vecteur d'expression et/ou de transfert selon 
l'invention ainsi que les animaux transgeniques qui en derivent. 
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Le recepteur des glucocorticoides (GR) est une proteine regulatrice 
de transcription de genes qui medie Taction des glucocorticoTdes dans les 
cellules cibles. Le GR et d'autres membres de la superfamille des 
recepteurs nucleaires (facteurs de transcription actives par des ligands) 
5 presentent une structure modulaire commune. La region N-terminale 
variable contient Tactivite de transactivation constitutive AF-1. Le 
domaine central de liaison a I'ADN (DBD) est hautement conserve entre les 
differentes esp£ces et permet la liaison du recepteur a son element de 
reponse ADN apparente (GRE dans le cas du GR). Le domaine de liaison du 

10 ligand (LBD), localise dans la region C-terminale du GR, non seulement 
fixe le ligand, mais egalement comporte de multiples activites distinctes : 
une surface pour Tinteraction avec hsp90 et une surface distincte pour 
rhomodimerisation, un signal de localisation nucleaire et une fonction de 
transactivation AF-2 dependant du ligand (pour les articles de synthese et 

15 references, voir (1-5)). Le domaine LBD est fortement conserve entre les 
differentes especes. Une fonction dc transactivation AF-2 a ete identifie 
dans la partie C-terminale dc divers LBD (6-10). L'integrite de la partie 
centrale de la region contenant AF-2 est requise pour Tactivation de 
transcription, dependante de ligand, par les recepteurs nucleaires 

20 correspondants, et pour Tinteraction, entre cette region et des facteurs 
intermediates transcriptionnels apparentes (TIF, egalement denommes 
co-activateurs ou mediateurs) (11-19). II a etc propose un modele general 
(19) dans lequel la liaison du ligand induit un changement 
conformationnel du domaine de liaison du ligand en faisant intervenir en 

25 particulier la region C-terminale hebergeant la partie centrale de AF-2, en 
engendrant ainsi une surface pour une interaction efficace avec les TIF. 
Les LBD des recepteurs nucleaires contiennent des regions conservees 
possedant une structure canonique en helice. Ces donnees structurales ont 
permis d'effectuer un alignement commun pour les LBD de tous les 

30 recepteurs nucleaires. L'helice HI 2 contient la fonction de transactivation 
AF-2 (19). Les acides amines des helices Hll et 1112, notamment des 
recepteurs des glucocorticoTdes de differentes especcs telles que l'homme, 
le rat, la souris et le xenope, sont conserves. 
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Plusieurs mutations dans le LBD de GR ont ete decrites 
precedemment. On peut distinguer deux types majeurs de mutations : 

- le premier type consiste en mutations qui affectent positivement 
ou negativement Taffinite de liaison au ligand. Par exemple, les 
remplacements du residu cysteine 656 par la glycine dans le GR de 
rat (20) et du residu methionine 565 par Targinine ou du residu 
alanine 573 par la glutamine dans le GR humain (hGR)(21) 
augmentent Taffinite de liaison au ligand et conduisent a un 
decalage de la courbe de reponse en fonction de la dose pour la 
transactivation en direction des plus basses concentrations de 
ligand. Ces mutants sont par consequent designes par "super GR". 
De meme, on a rapporte des mutants ayant une affinite de liaison au 
ligand plus faible (21-24). Les mutations de LBD qui decalent la 
courbe de reponse en fonction de la dose de ligand en direction des 
plus hautes concentrations de ligand, resultent d'une affinite 
alteree de liaison de Thormone (25-26) ; 

- le second groupe de mutants LBD comprend ceux affectant la 
fonction d'activation transcriptionnelle (AF-2), sans alterer la 
liaison au ligand. Comme exemples, on peut citer des mutations dans 
la region contenant AF-2 qui sont liees a une perte ou une 
diminution du potentiel de transactivation, mais n'affectent pas 
Paffinite de liaison au ligand (6-10). 

La fusion du domaine de liaison du ligand (LBD) dc recepteurs 
nucleaires a des proteines heterologues a permis de controler, dans de 
nombreux cas, I'activite de ces dernieres. 

Les activites de Myc, c-Abl, Src, erbBl, Raf, El A Cre et FLP, peuvent 
etre modulees en realisant des proteines de fusion avec le LBD de 
recepteurs nucleaires (27-29). Cependant, les ligands dc ces recepteurs 
sont presents dans de nombreux syst£mes biologiques, pouvant ainsi 
induire un niveau d'activite basal. Pour eviter de tels problemes, un LBD 
mute du recepteur des oestrogenes (RE), a ete fusionne a la proteine c-Myc 
(30), ou aux recombinases Cre et FLP (28 et 29). 



4 
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Les recombinases de la famille des integrases X catalysent Pexcision, 
Pinsertion, Pinversion ou la translocation de fragments d'ADN au niveau 
de sites specifiques de reconnaissance desdites recombinases (31-36). Les 
recombinases sont actives dans les cellules animales (35). 
5 La recombinase Cre, une integrase de 38 KDa du bacteriophage PI, 

catalyse la recombinaison entre deux sequences d'ADN de 34 paires de 
bases appelees loxP en Pabsence de cofacteurs (32, Figure 1). 

La position sur une ou plusieurs molecules d'ADN et Porientation de 
sites loxP Tun par rapport a Pautre determinent le type de fonction de la 

10 recombinase, excision, insertion, inversion ou translocation notamment, 
la recombinase Cre (figure 1). Ainsi Pactivite recombinase de Cre est une 
inversion lorsque deux sites LoxP sont tete-beche* sur un meme fragment 
d'ADN et une excision, lorsque les sites LoxP sont en repetition directe sur 
un meme fragment d'ADN. L'activite de la recombinase est une insertion 

15 lorsqu'un site loxP est present sur un fragment d'ADN, une molecule 
d'ADN telle qu'un plasmide contenant un site loxP pouvant etre inseree au 
niveau dudit site loxP (figure 1). La recombinase Cre peut egalement 
induire une translocation entre deux chromosomes a condition qu'un site 
loxP soit present sur chacun d'eux (37) (figure 1). De maniere plus 

20 generale, la recombinase Cre est done capable d'induire la recombinaison 
entre une ou plusieurs molecules d'ADN differentes, a condition qu'elles 
soient porteuses de sites loxP. 

De meme la recombinase FLP, une recombinase de 43 KDa de 
Saccharomvces cerevisiae. est capable du meme type d'action sur les 

25 fragments d'ADN contenant des sites de reconnaissance FRT (34). 

En realisant une proteine de fusion (chimere) entre la recombinase 
Cre et la region C-terminale du recepteur humain des oestrogenes 
contenant une Valine en position 400, on obtient une molecule capable 
d'exciser, en presence du ligand du recepteur, Poestradiol, les sequences 

30 d'ADN localisees entre deux sites loxP, ainsi qu'un des sites loxP, lorsque 
ceux-ci sont en repetition directe, alors qu'en absence de ligand, 1'excision 
n'a pas lieu (28). 
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L'activit6 de la recombinase FLP est egalement regulable, en 
realisant des chimeres entre la FLP et le domaine de liaison de recepteurs 
nucleaires. En fusionnant la FLP avec le LBD du recepteur des oestrogenes 
ou du recepteur des glucocorticoides en Pabsence de ligand, Pactivite 
5 recombinase est tres faible, alors qu'elle est rapidement induite par les 
ligands respectifs des LBD (29). 

Toutefois, Putilisation de proteines de fusion entre des recombinases 
et des LBD de recepteurs nucleaires pour exciser de facon contrdlee des 
fragments d'ADN situes entre des sites de reconnaissance desdites 
10 recombinases peut poser probleme, etant donne que les concentrations de 
ligand presentes chez Panimal ou dans les milieux de culture des cellules 
peuvent etre suffisantes pour induire au moins partiellement, Pactivite 
recombinase. 

La presente invention fournit un systeme de recombinaison 

15 inductible chez les animaux, notamment les mammiferes, grace a 
Putilisation d'une proteine de fusion realisee entre une recombinase, et le 
domaine de liaison du ligand, derive du recepteur des glucocorticoides, 
dont Tactivite est inductible par des glucocorticoides synthetiques, mais 
pas par des glucocorticoides naturels notamment k des concentrations 

20 inferieures a 10-6 M c'est-a-dire physiologiques. 

Pour eviter Tinduction de Pactivite recombinase de la proteine 
chimere par les ligands endogenes, la presente invention se propose de 
fournir en effet une mutation dans le LBD du recepteur des 
glucocorticoides lui permettant d'etre plus fortement active en presence 

25 de ligands glucocorticoides synthethiques, qu'en presence de ligands 
glucocorticoides naturels aux concentrations physiologiques . 

La presente invention a en effet pour objet un recepteur nucleaire 
des glucocorticoides modifie, notamment mute dans la region du domaine 
de liaison du ligand, de sorte que Pactivite dudit recepteur est inductible 

30 plus fortement par un ligand glucocorticoide synthetique que par un 
ligand glucocorticoide naturel. 

Selon la presente invention on entend par "recepteur (mute) des 
glucocorticoides inductible plus fortement par un ligand glucocorticoide 
synthetique que par un ligand glucocorticoide naturel" que Pactivite du 



i 
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recepteur mute selon Pinvention est induite plus fortement par des 
ligands glucocorticoides synthetiques que par des ligands glucocorticoides 
naturels a une concentration donnee et que le recepteur mute des 
glucocorticoides selon Pinvention est beaucoup moins sensible aux 
5 glucocorticoides naturels que le recepteur sauvage. 

Par "activite dudit recepteur" on entend ici Pactivitd 
transcriptionnelle dudit recepteur et/ou le cas echeant Pactivite de 
regulation de Pactivite d'une proteine fusionnee audit recepteur ou audit 
domaine de liaison du ligand, induite en presence de glucocorticoides. On 
10 cite plus particulierement Pactivite d'une proteine recombinase 
fusionnee audit recepteur ou audit domaine de liaison du ligand dudit 
recepteur. 

Par "glucocorticoides naturels", on entend ici des hormones 
steroides secretees par le cortex des glandes surrenales tellcs que le 

15 Cortisol, la corticosterone, ou Paldost^rone. Par "glucocorticoides 
synthetiques", on entend des agonistes de synthese chimique dudit 
recepteur pour Pactivit6 concernee. On cite parmi ceux-ci, la 
dexamethasone, le triamcinolone acetonide, le RU 486, le RU 28362, le 
bimedrazol, le fluocinolone acetonide. 

20 Certains ligands synthetiques seront agonistes pour induire unedite 

activite particuliere du recepteur et antagonistes par rapport a une autre 
activite du recepteur. Ainsi, le compose RU 486 induit Pactivite d'une 
proteine recombinase fusionnee audit recepteur ou audit domaine de 
liaison du ligand du recepteur mais n'induit pas Pactivite 

25 transcriptionnelle du recepteur. 

Le ligand glucocorticoide synthethique peut se lier au recepteur 
nucleaire sauvage (non mute), mais il se peut que ledit ligand synthetique 
se lie au recepteur mute et pas au recepteur naturel. 11 se peut aussi que si 
ledit ligand synthetique se lie au recepteur sauvage, 1 'activite de celui-ci 

30 ne soit neanmoins pas induite par liaison au ligand synthetique. 

On a en particulier, identifie une mutation dans le domaine LBD des 
recepteurs nucleaires des glucocorticoides (isoleucine --> threonine) 
situee entre les helices Hll et H12 (19). Cette mutation entraine une perte 
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d'activite du recepteur en presence de glucocorticoi'des naturels. Plus 
precisement, ce recepteur des glucocorticoides mute entre Hll et H12 n'a 
pas ou tres peu d'activite transcriptionnelle en presence de 
glucocorticoides naturels aux concentrations physiologiques naturelles de 
ceux-ci notamment des concentrations inferieures a 10-6 M. Son activite 
peut cependant etre induite par des ligands glucocorticoides synthetiques, 
notamment la dexamethasone (dex). 

La presente invention a plus particulierement pour objet un 
recepteur humain mute appele hGR (I747/T) caracterise en ce qu'il a pour 
sequence, la sequence en acides amines du recepteur nucleaire humain 
des glucocorticoides sauvage avec une mutation isoleucine - > threonine 
en position 747, et plus particulierement encore un recepteur nucleaire 
humain modifie qui a pour sequence en acides amines, une sequence 
substantiellement telle que representee dans 1'IDS n° 1. 

La mutation de Pisoleucine 747 en threonine dans la partie C- 
terminale du domaine de liaison du ligand (LBD) du recepteur des 
glucocorticoides altere la capacite des ligands naturels a en induire 
l'activit£ de transactivation. Les glucocorticoides naturels tels que le 
Cortisol, Taldosterone ou la corticosterone sont tres faiblement actifs ou 
totalement inactifs avec le mutant GR (I747/T), tandis que des 
glucocorticoides synthetiques tels que la dexamethasone (Dex) stimulent 
efficacement la transactivation mediee par GR (I747/T). Toutefois, la 
courbe correspondante de reponse en fonction de la dose de ligand, pour la 
transactivation induite par Dex, est decalee vers les plus fortes 
concentrations, par comparaison avec celle obtenuc avec le GR de type 
sauvage (TS). Ni le decalage, ni ^inaptitude du Cortisol a activer 
efficacement GR (I747/T) ne sont dus a une affinite alteree de liaison au 
ligand in vitro. 

En effet, la mutation dans le LBD de GR (I747/T) n'altere pas 
sensiblement l'affinite de liaison au ligand in vitro. Toutefois, ce mutant 
presente un important decalage par rapport au GR TS de la courbe 
d'activite vers les fortes concentrations de ligands. Aussi des 
concentrations dites physiologiques de ligands glucocorticoides naturels 
suffisantes pour activer le GR TS, n'entrainent qu'une activite residuelle 
ou nulie chez le GR mutant. 
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Ce mutant differe des autres mutants de LBD de GR decrits 

precedemment (22, 38), dont la fonction d'activation aJteree est en etroite 

correlation avec une modification de leurs proprietes de liaison au ligand 
in vitro. 

La presente invention a aussi pour objet un domaine de liaison du 
ligand du recepteur nucleaire de glucocorticoi'des selon l'invention et 
particulierement, le domaine LBD [GR(I747/T)J caracterise en ce qu'il a 
une mutation isoleucine -> threonine entre les helices Hll et H12. Plus 
particulierement il a pour sequence, la sequence en acides amines du 
domaine de liaison du ligand du recepteur des glucocorticoi'des humain 
substantiellement telle que representee dans 1'IDS n° 1 de 1'acide amine 
532 a 1'acide amine 777 avec une mutation isoleucine --> threonine en 
position 747. 

La presente invention fournit egalement un fragment d'ADN codant 
pour un recepteur nucleaire de glucocorticoides modifie, notamment mute 
dans la region du domaine de liaison du ligand (LBD) selon l'invention, 
ainsi qu'un fragment d'ADN codant pour un domaine de liaison du ligand 
(LBD) du recepteur modifie selon l'invention. 

La presente invention a done plus precisement pour objet un 
fragment d'ADN codant pour un recepteur nucleaire des glucocorticoides 
sauvage avec une mutation de l'isoleucine en threonine situee entre les 
helices Hll et HI 2 de la sequence d'acides amines dudit recepteur, et plus 
particulierement encore un fragment d'ADN caracterise en ce qu'il a pour 
sequence, une sequence codante du recepteur nucleaire humain des 
glucocorticoides dont la sequence en acides amines est substantiellement 
telle que representee dans l'IDS n'l. 

Dans un mode de realisation, la presente invention a pour objet un 
fragment d'ADN, caracterise en ce qu'il a pour sequence, la sequence de 
PADNc du recepteur nucleaire humain des glucocorticoides 
substantiellement telle que representee dans l'IDS n° 1 comportant 1c 
codon ACC codant pour la threonine en position 747 de la sequence d'acides 
amines dudit recepteur. 
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De meme la presente invention a pour objet un fragment d'ADN 
codant pour le domaine de liaison du ligand (LBD) du recepteur nucleaire 
des glucocorticoides modifie avec une mutation isoleucine --> threonine 
situee entre les helices Hll et H12 et notamment en position correspondant 
a la position 747 de la sequence en acides amines du recepteur nucleaire 
humain des glucocorticoides. 

Plus particulierement, la presente invention fournit un fragment 
d'ADN codant pour le domaine de liaison du ligand du recepteur nucleaire 
humain des glucocorticoides modifie, caracterise en ce qu'il a pour 
sequence, une sequence codant pour les acides amines du domaine de 
liaison du ligand du recepteur nucleaire humain des glucocorticoides dont 
la sequence en acides amines est substantiellement telle que representee 
dans 1'IDS n" 1 de l'acide amin<§ 532 a l'acide amine 777. 

Plus particulierement encore, la presente invention fournit un 
fragment d'ADN, caracterise en ce qu'il a pour sequence, la sequence 
d'ADNc codant pour le domaine de liaison du ligand (LBD) du recepteur 
nucleaire humain des glucocorticoides substantiellement telle que 
representee dans 1'IDS n" 1 du codon 532 au codon 777 avec le codon ACC en 
position 747. 

La presente invention a en outre pour objet un systeme vectoriel 
d'expression conditionnelle d'une proteine notamment une proteine 
etrangere dans des cellules hotes comportant un element de controle de la 
transcription inductible par un complexe forme par un recepteur 
nucleaire des glucocorticoides et un ligand, caracterise en ce qu'il 
comprend : 

- un premier fragment d'ADN consistant en un fragment d'ADN 
codant pour ladite proteine sous le controle d'elements assurant son 
expression dans lesdites cellules hotes, lesdits elements assurant son 
expression comprenant une sequence de controle de transcription 
(RE) inductible par le recepteur selon l'invention complexe a un 
ligand glucocorticoide synthetique, et 
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- un deuxieme fragment d'ADN consistant en un fragment d'ADN 
fonctionnel codant pour ledit recepteur selon l'invention ou 
seulement une partie dudit fragment comprenant la region qui 
reconnait le ligand (LBD) selon l'invention, et la region de liaison a 

5 TADN (DBD) qui se fixe sur ladite sequence de controle de la 

transcription (RE). 

- lesdits premier et deuxieme fragments d'ADN pouvant etre portes 
par un meme vecteur ou deux vecteurs separement. 

Dans un mode de realisation, le systeme vectoriel comporte I'ADNc 
10 codant pour : 

- la region LBD, representee par des codons codant les acides amines 
n° 532 a 777 dans T1DS n° l f et 

- la region DBD, representee par des codons codant les acides amines 
n° 421 a 487 dans FIDS n° 1. 

15 Certaines cellules ont du GR endogene qui peut etre active par des 

ligands naturels et des ligands synthetiques. Si on veut activer un gene 
donne a volonte dans de telle cellules, sans qu'il puisse etre active par les 
ligands endogenes ni par les recepteurs endogenes, il faut que ce gene 
contienne un RE different du GRE et utiliser un activateur chimerique 

20 comportant le DBD correspondant et un LBD mute selon Tinvention. Ce 
gene pourra done etre active par des ligands synthetiques, mais non par 
des ligands naturels. 

C'est pourquoi dans un mode de realisation, on remplace le domaine 
de liaison a l'ADN (DBD) du recepteur des glucocorticoides par celui d'un 

25 autre transactivateur, notamment celui de la proteine de levure Gal 4 et on 
remplace la sequence de controle de transcription (RE) du recepteur des 
glucocorticoides par celle d'un autre transactivateur, notamment la 
sequence 17 mere (17m) reconnue par la proteine Gal4. 

La presente invention a done egalement pour objet un proc^de 

30 d'expression d'une proteine etrangere dans des cellules humaines ou 
animales notamment de mammiferes, caracterise en ce que Ton cultive des 
cellules qui contiennent un systeme vectoriel d'expression selon 
l'invention, et en ce qu'on ajoute ledit ligand synthctique, dans le milieu 
de culture, puis on recupere la proteine synthetisee. 

35 
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Les ligands glucocorticoides synthetiques diffusent librement dans 
les cellules lorsqu'ils ajoutes dans le milieu de culture ou injectes dans un 
animal. 

Dans ce procede on utilisera en particulier un ligand synthetique 
5 choisi parmi la dexamethasone, le triamcinolone acetonide, le RU2836, le 
bimetrazole, le deacylcortivazol et le fluocinolone acetonide. 

La presente invention a en outre pour objet une proteine de fusion 
comprenant un recepteur selon Tinvention ou un domaine de liaison du 
ligand selon l'invention et une proteine dont Tactivite est inductible plus 
10 fortement par liaison dudit recepteur ou dudit domaine de liaison du ligand 
(LBD) dudit recepteur avec undit ligand glucocorticoide synthetique 
qu'avec un ligand glucocorticoide naturel. 

En particulier, la presente invention a pour objet une proteine de 
fusion qui comprend une proteine recombinase et plus particulierement 
15 de la famille des int^grases X et plus particulierement encore, la proteine 
Cre du bacteriophage 

Dans un mode de realisation, la proteine de fusion comporte la 
partie C-terminale de la region charniere D du recepteur nucleaire 
humain des glucocorticoides, intercal£e entre la proteine Cre et ledit 

20 domaine de liaison du ligand du recepteur modifie selon 1 'invention. 

L'activite recombinase proprement dite de la proteine de fusion est 
similaire a celle de Cre. Elle permet done, comme Cre, d'exciscr ou 
d'inverser des sequences d'ADN localisees entre des sites loxP, d'inserer un 
plasmide contenant un site loxP au niveau d'un site loxP localise dans le 

25 genome, ou d'effectuer une translocation entre deux chromosomes 
contenant chacun un site loxP. 

La presente invention a egalement pour objet un gene de fusion 
codant pour la proteine de fusion selon Tinvention comprenant un 
fragment d'ADN codant pour un recepteur nucleaire de glucocorticoides 

30 modifie ou un domaine de liaison du ligand dudit recepteur selon 
Tinvention, ainsi qu'un fragment d'ADN codant pour une proteine dont on 
veut reguler l'activite, ladite activite etant inductible par liaison dudit 
recepteur ou dudit domaine de liaison du ligand avec undit ligand 
glucocorticoide synthetique mais pas par liaison avec un ligand 

35 glucocorticoide naturel lorsque ladite proteine se trouve fusionnee audit 
recepteur ou audit domaine de liaison du ligand dudit recepteur. 
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Plus particulierement la presente invention a pour objet un gene de 
fusion comprenant dans le sens 5' «> 3' : 

- un fragment d'ADN codant pour la recombinase Cre du 
bacteriophage P] ; 

- un fragment d'ADN codant pour tout ou partie de la region 
charniere D du recepteur nucleaire des glucocorticoides, region 
situee entre le domaine DBD et le domaine LBD, et 

- le fragment d'ADN codant pour le domaine de liaison du ligand 
(LBD) modifie, notamment mute, du recepteur nucleaire des 
glucocorticoides selon l'invention. 

Et plus particulierement encore, la presente invention a pour objet, 
un gene de fusion, caracterise en ce qu'il a pour sequence , une sequence 
codant pour la sequence d'acides amines de T1DS n° 2 comprenant : 

- les acides amines 1 a 343 qui correspondent a la recombinaison 
Cre; 

- les acides amines 346 a 377 qui correspondent a la region C- 
terminale de la region D du recepteur humain des glucocorticoides ; 

- les acides amines 378 a 623 qui correspondent au LBD [GR(I747/T)J. 
Dans un mode de realisation particulier, le gene de fusion a 

substantiellement pour sequence, la sequence Cre-LBD[GR(1747/T)] telle 
que representee dans PIDS n° 2 dont les acides amines 626 a 667 
correspondent a la region F du recepteur humain des oestrogenes. 

La presente invention a egalement pour objet un vecteur 
d'expression de la proteine de fusion codee par le gene de fusion selon 
rinvention, dans des cellules hotes animates notamment de mammiferes, 
caracterise en ce qu'il comporte le gene de fusion selon rinvention, plac<§ 
sous le controle d'elements depression assurant son expression dans 
lesdites cellules hotes. Le vecteur d'expression de la proteine de fusion 
peut egalement etre un vecteur d'integration dans le genome des cellules 
hotes. 

Dans les vecteurs selon l'invention, pour exprimer le recepteur, le 
LBD ou la proteine de fusion selon l'invention, il faut que les fragments 
d'ADN codant pour ces molecules soient placees sous le controle de 
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sequence de regulation, notamment des sequences promotrices/ enhancer. 
On peut utiliser en particulier des sequences promotrices/enhancer du 
virus SV 4 o« 

La presente invention a en outre pour objet un procede de 
recombinaison, notamment d'excision, insertion, inversion ou 
translocation conditionnelle au niveau d'un fragment d'ADN contenant un 
ou deux sites de reconnaissance specifique d'une proteine recombinase 
dans des cellules hotes humaines ou animates, notamment de mammiferes, 
caracterise en ce qu'il comporte les etapes dans lesquelles : 

1) on introduit une proteine de fusion selon Pinvention ou un 
vecteur d'expression de ladite proteine de fusion selon Pinvention 
dans lesdites cellules hotes dans des conditions permettant 
Pexpression de la proteine de fusion selon Pinvention et, 

2) on complexe ladite proteine de fusion avec undit ligand 
glucocorticoide synthetique, en mettant ledit ligand en presence 
desdites cellules hotes. 

La presente invention fournit done un procede de deletion 
conditionnelle d'un fragment d'ADN dans lequel on met en oeuvre un 
procede d'excision selon Pinvention, et dans lequel ledit fragment d'ADN a 
exciser est integre entre deux sites de reconnaissance de protdine 
recombinase orientes en repetition directe. En particulier, ledit fragment 
d'ADN peut etre choisi de telle sorte que Pexcision dudit fragment d'ADN a 
pour effet, Pinactivation dudit gene. L'excision dudit fragment d'ADN peut 
egalement permettre la synthese d'une proteine fonctionnelle, si ledit 
fragment contient par exemple un codon stop ou un signal de 
polyadenylation. 

Dans le mode prefere de realisation selon Pinvention, lesdits sites de 
reconnaissance specifique de la proteine recombinase sont les sites loxP et 
ladite proteine recombinase est la proteine Cre du bacteriophage 

Ledit fragment d'ADN que Pon veut recombiner, notamment exciser 
et le ou lesdits sites de reconnaissance specifiques d'une proteine 
recombinase peuvent etre portcs par un vecteur plasmidique ou viral, ou 
integres dans le chromosome des cellules hotes. 
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^integration d'un gene portant des sites loxP dans un genome peut 
etre aleatoire ou ciblee, En particulier, Pintegration des sites de 
reconnaissance specifique de la proteine recombinase, notamment du ou 
des sites loxP pour la recombinase Cre, peut se faire par recombinaison 
5 homologue du gene comportant ledit fragment d'ADN a exciser ou inverser 
(2 sites loxP) ou respectivement inserer ou transloquer (1 site loxP) avec 
undit gene modifie comportant ledit fragment d'ADN a exciser flanque en 
5' et/ou 3' par le ou lesdits sites de reconnaissance de recombinase en 
fonction de Papplication desiree, notamment les sites loxP. 

10 On a construit une proteine chim^rique, Cre-LBD[GR(1747/T)) de 

TIDS n° 2, composee de la recombinase Cre fusionnee au LBD de GR 
(I747/T). La proteine de fusion Cre-LBD[GR(I747/T)] permet de realiscr une 
recombinaison entre des sites loxP, dans une cellule de mammifere, suite a 
un traitement par des glucocorticoides synthetiques. En Pabsence de 

15 traitement, ou en presence de concentrations de glucocorticoides naturels 
allant jusqu'a lO 6 M aucune excision n'est observee. Cette chimere est 
capable d'exciser les sequences d'ADN situees entre des sites loxP integres 
pr^alablement dans le genome de cellules F9 (embryocarcinome de souris) 
ou presents sur un plasmide apres transfection de ces cellules avec un 

20 vecteur exprimant Cre-LBD[GR(1747/T)], suite a un traitement i la Dex a 10- 
6 M ou 10* 7 M, alors qu'a de telles concentrations, le Cortisol n'induit pas 
d'activite recombinase. Comme on Pa deja mentionnd, le vecteur 
d'expression de Cre-LBD[GR(I747/T)] peut egalement etre un vecteur 
d 'integration dans le genome des cellules hotes. 

25 Ce systeme permet done de liberer Pactivite recombinase de 

proteine chimerique a un moment donne et choisi^ La proteine de fusion 
Cre-LBD[GR(I747/T)] peut etre exprimee dans des cellules contenant des 
sites loxP, sans modifier le locus contenant les sites loxP. La recombinaison 
au niveau des sites loxP a lieu uniquement apres traitement aux 

30 glucocorticoides synthetiques. De plus en exprimant la proteine de fusion 
Cre-LBD[GR(I747/T)] dans un animal sous le controle d'un promoteur a 
specificite cellulaire, on peut obtenir une recombinaison entre des sites 
loxP, specifiquement dans ces cellules. 
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La presente invention a egalement pour objei un vecteur de 
transfert d'un fragment d'ADN dans des cellules botes humaines ou 
animates, notamment mammiferes, caracterise en ce qu'il comporte undit 
fragment d'ADN a transferer eomprenant des sites de reconnaissance 
sp^cifiques de la recombinase, notamment deux sites loxP, orientes a 
repetitions directe et une cassette d'expression d'un g£ne de fusion selon 
l'invention. De fagon appropriee les deux sites sont places a chaque 
extremity dudit fragment d'ADN. 

De preference, le gene de fusion est place sous le controle 
d'elements d'expression specifiques des cellules hotes, en particulier, il 
comporte la sequence du plasmide pCre-LBD[GR(1747/T)] de PIDS n° 3. 

Dans le proc^de d 'excision selon l'invention, ledit fragment d'ADN a 
exciser peut etre transfere dans les cellules hotes avant, en meme temps, 
ou apres I'etape d'introduction de la proteine de fusion ou d'un vecteur de 
transfert. 

Le vecteur de transfert selon Tinvention peut etre, un vecteur 
plasmidique ou un vecteur viral. Le mode de transfert varie en fonction du 
type de cellule cible et de l'efficacite recherchee. 

Lorsque le materiel est transfere dans les cellules germinales, on 
utilise de preference la microinjection du pronucleus male d'un ovocyte 
feconde. Pour introduire TADN dans des cellules embryonnaires 
pluripotentes (cellules ES), la technique appropriee sera plutot 
Peiectroporation ou l'utilisation de vecteurs retroviraux 

Pour des experiences portant sur les cellules somatiques, on 
cherche a obtenir une efficacite maximale, d'ou l'utilisation 
preferentielle de vecteurs viraux : retrovirus et adenovirus, 
principalement. Ces virus doivent etre defectifs, notamment pour une 
application en sante humaine pour empecher toute multiplication et tout 
risque de revertion. 

Apres integration ou non de ce type de vecteurs dans le genome, le 
systeme Cre-lox permet d'exciser certaines sequences virales, qui 
pourraient eventuellement presenter un risque quant a la propagation 
ulterieure du virus. Ceci est tres avantageux pour l'utilisation de tels 
vecteurs en therapie genique. Des vecteurs contenant une cassette 
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d'expression du gene Cre-LBD[GR(I747/T)] et des sites lox encadrant un 
g£ne potentiellement "dangereux" et cette cassette permettent, le cas 
echeant apres integration dans le genome du virus recombine, d'eliminer 
ces elements. Inversement, on peut egalement activer un gene que Ton a 
integre sous forme inactive. Cette activation peut resulter de la deletion 
d'un fragment dudit gene par exemple un codon stop ou un signal de 
polyadenylation encadre de sites loxP. 

Lorsque Ton veut transferer du materiel gen6tique dans une 
cellule, on utilise en general des constructions comportant le gene h 
transferer, auquel on a adjoint 6ventuellement un gene auxiliaire, 
conferant un avantage selectif (par exemple, le gene neo, conferant la 
resistance a Pantibiotique G418). 

Les marqueurs de selection peuvent egalement etre excises par le 
procede d'excision selon Pinvention. 

En utilisant des techniques classiques, on peut modifier par 
recombinaison homologue des genes de mammiferes, notamment de souris. 
Un site loxP peut etre introduit dans un gene qu'on veut modifier, ou deux 
sites loxP peuvent encadrer des sequences que Ton veut modifier. En 
particulier, le marqueur de selection utilise pour permettre d'identifier les 
evenements de recombinaison homologue peut etre genant, et peut dans 
un premier temps etre elimine, si necessaire, s'il est lui meme encadre de 
sites de reconnaissance de recombinase tels que des sites loxP ou FRT, en 
microinjectant la proteine recombinase correspondante, en transfectant 
les cellules, notamment des cellules ES, avec un vecteur d'expression pour 
une proteine recombinase, ou en croisant des souris portant le marqueur 
de selection avec des souris exprimant la recombinase desiree, notamment 
la recombinase Cre. Ceci permet d'obtenir des souris dont la seule 
modification au niveau du locus modifie est Pinsertion de sites de 
reconnaissance tels que loxP. Ces souris peuvent par la suite etre croisees 
avec des souris exprimant Cre-LBD[GR(I747/T)] et la modification du locus 
obtenue par traitement avec le ligand tel que la Dex. Ceci permet 
d'inactiver ou de modifier un gene a un moment determine, et done 
d'etudier la fonction de ces genes a differents moments du developpement. 
Ceci est particulierement interessant pour Petude des genes qui sont 
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indispensables au bon deroulement du developpement embryonnaire. En 
effct, dans certains cas, les techniques classiques de recombinaison 
homologue entrainent la mort de I'embryon et ne permettent pas d'etudier 
la fonction du gene a des stades plus tardifs. 
5 Le transfert de genes dans une cellule donnee est a la base de la 

therapie genique. Les vecteurs les plus efficaces a cet egard sont des 
vecteurs viraux, en particulier retroviraux ou adenoviraux (39). La 
presente invention a done 6galement pour objet un vecteur de transfert 
selon Tinvention comportant ledit fragment d'ADN a transferer 

10 comportant deux sites loxP orientes en repetition directe pour une 
utilisation comme medicament en therapie genique, lorsque celui-ci est 
administre en combinaison avec undit ligand glucocorticoid synth^tique 
tel que la dexamethasone. 

Ce type de vecteur permet de transferer le fragment d'ADN desire 

15 comportant deux sites de reconnaissance specifique de recombinase dans 
un gene de sorte que les sequences d'ADN situees entre les deux sites loxP 
pourront etre excisees de facon conditionnelle apres administration dudit 
ligand glucocorticoi'de synthetique. 

La presente invention fournit en outre des cellules humaines ou 

20 animales notamment de mammiferes, transferees par un vecteur 
d'expression et de transfert d'une proteine de fusion selon Tinvention, ou 
des cellules humaines ou animales notamment de mammiferes, dans 
lesquelles un fragment d'ADN a ete transfere a Taide d'un vecteur de 
transfert selon Tinvention, ou encore des cellules humaines ou animales, 

25 notamment de mammiferes exprimant de fagon constitutive la proteine de 
fusion selon Tinvention. 

La presente invention a enfin pour objet supplementaire, un 
animal transgenique, notamment une souris comportant un gene 
fonctionnel de la proteine de fusion selon Tinvention, celui-ci etant 

30 notamment integre dans un de ses chromosomes. 

Ou encore un animal transgenique comportant un gene fonctionnel 
de la proteine de fusion selon Tinvention, dans lequel un gene d'interet 
est modifie par insertion de site(s) loxP, notamment integre(s) dans un ou 
plusieurs chromosomes. 

35 
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La presente invention a enfin pour objet l'utilisation d'un vecteur 
d'expression ou de transfert de cellules ou d'un animal selon l'invention 
comme outil d'analyse ou d'etude du fonctionnement d'un gene donne 
d'une cellule hote et une methode de traitement de cellules ex vivo ou in 
5 vitro impliquant la mise en oeuvre d'un procede d'excision, insertion, 
inversion ou translocation selon l'invention et 1'utilisation d'un vecteur 
d'expression ou de transfert selon l'invention. 

D'autres caractSristiques et avantages de la presente invention 
apparaitront a la lumiere de la description detaillee qui va suivre. 
10 L'IDS n° 1 represente les sequences nucleotidique et peptidique de 

de GR(I747/T) avec le DBD correspondant aux aa 421-487 et le LBD 
correspondant aux aa 532-777; 

L'IDS n° 2 represente les sequences nucleotidique et peptidique de 
Cre-LBD[GR(1747/T)] 
15 Les nucleotides 1-1029 codent pour la recombinase Cre (aa 1-343). 

Les nucleotides 1036-1131 codent pour la region C-terminale de la 
region D du recepteur humain des glucocorticoids [aa 500-531 de 
GR(I747/T) ; aa 346-377 de Cre-LBD[GR(I747/T)]. 

Les nucleotides 1 132-1869 codent pour le LBD de GR(I747/T) [aa 532- 
20 777 de GR(I747/T) ; aa 378-623 de Cre-LBD[GR(I747/T)]. 

Les nucleotides 1876-2001 codent pour la region F du recepteur 
humain des oestrogenes [aa 554-595 de HEG0 ; aa 626-667 de Cre- 
LBD[GR(I747/T)]. 

Les nucleotides 1777-1779 correspondent a la mutation qui remplace 
25 1'isoleucine par une threonine. 

L'IDS n° 3 represente la sequence nucleotidique du plasmide pCre- 
LBD[GR(I747/T)] 

Les IDS n° 4 a 17 representent les sequences nucleotidiques des 
differents oligonucleotides utilises selon l'invention. 
30 La Figure 1 est une representation schematique d'activites 

recombinases de Cre. 

La Figure 2 represente Pactivite transcriptionnclle de recepteur GR 
mutant et de type sauvage en reponse a la dcxamethasone ct la capacite de 
fixation de la dexamethasone aux deux reccpteurs. 

35 
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La Figure 3 represente une analyse de Scatchard de la liaison de 
[3H]-dexamethasone aux recepteurs de type sauvage et mutant 1747/T. 

La Figure 4 represente la competition par RU 486 des activates de 
liaison de Dex et de transactivation du recepteur de type sauvage (TS) et 
5 GR(I747/T). 

La Figure 5 est une representation schematique des proteines Cre, 
hER, Cre-ER, hGR et Cre-LBD[GR(I747/T)]. 

La Figure 6 est une representation schematique du plasmide pCre- 
LBD[GR( 1747/T)]. 

10 La Figure 7 represente la sequence nucleotidique de pCre- 

LBD[GR(I747/T)] et la sequence peptidique de Cre-LBD[GR(I747/T)]. 

La Figure 8 represente la strategic PCR utilisee pour detecter les 
alleles sauvages, mut6s et recombines dans le test d'activite recombinase 
de Cre-U5D[GR( 1747/T)]. 
15 La Figure 9 represente Panalyse par PCR de I'excision des sequences 

situees entre les sites ioxP apres transfection transitoire de pCre- 
LBD[GR(I747/T)] dans les cellules murines RXRa +/ -<LNL) san s ajout de 
ligand, ou traitees au Cortisol (10* 6 M) ou a la dexamethasone (10* 6 M). 

La Figure 10 represente ('analyse par PCR de Pactivite recombinase 
20 de Cre-GR( 1747/T) dans les cellules RXRa +A ( LNL > : Cre-GR(1747/T) non 
traitees ou traitees avec du conisol ou de la dexamethasone a 106NL 

La Figure 11 recapitule Tactivite recombinase de Cre- 
LBD[GR(I747/T)] dans la lignee RXRa+^fLNU exprimant la recombinase de 
faqon constitutive, en presence de concentrations croissantes de 
25 differents ligands. 

La Figure 12 represente ('analyse par PCR de Pactivite recombinase 
de Cre-LBD[GR(I747/T)] induite par des ligands synthetiques malgre la 
presence de ligands naturels. 

La Figure 13 represente le test de Pactivite recombinase de Cre- 
30 LBD[GR(1747/T)] dans les cellules humaines HeLa. 

La Figure 14 est une representation schematique du trangene Cre- 
LBD[GR(I747/T)]. La partie (a) represente le fragment d'ADN contenant la 
sequence codante du gene Cre-LBD[GR( 1747/T)] utilise pour etablir des 
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souris transgeniques et la partie (b) represente la structure genomique de 
l'allele RXRa de type sauvage, de l'allele cible RXRa dAF 2(LNL) e t de l'allele 
excise RXRaA(AF2(L) ainsi que la strategic PCR pour 1'analyse de I'excision 
du marqueur. 

La Figure 15 represente 1'analyse par PCR de l'activite recombinase 
de Cre-LBD[GR(I747/T)] chez la souris traitee a la dexamethasone. 

EXEMPLE 1 : Remplacement de 1'isoleucine 747 par la threonine 
dans le recepteur nucteaire humain des glucocorticoides. 

On a obtenu un mutant GR humain comportant un seul 
remplacement d'acide amine, celui du residu isoleucine 747 par un residu 
threonine, localise entre les helices Hll et H12, dans la partie C-terminale 
du domaine de liaison du ligand. Cette mutation est apparue spontanement 
dans les vecteurs derives de HG1 (40). Ce mutant differe des autres mutants 
de LBD de GR dccrits precedemment (22, 38), dont la fonction deactivation 
alteree est en etroite correlation avec une modification de leurs proprietes 
de liaison du ligand in vitro. 

1. Mutation dans le GR humain 

Le vecteur d'expression du GR humain de type sauvage (pSG5HG0) a 
ete obtenu en clonant le fragment BamHI d'environ 2.9 kb (contenant le 
cadre de lecture ouvert du hGR de type sauvage) isole du vecteur HGO 
precedemment decrit (40), dans le site BamHI du vecteur d'expression 
pSG5 (41). 

Toutes les constructions d'ADN ont ete effectuees au moyen de 
techniques classiques (42). Le vecteur d'expression GR (I747/T)hGR codant 
pour un mutant portant la mutation I 747->T, a 6te obtenu a partir du 
fragment de digestion Pstl-PflMI du vecteur d'expression HG1 (40) mute 
qui etait ligature dans les sites PstI et PflMI correspondants de pSGSHGO. 

En plus de la mutation du residu isoleucine 747 en un residu 
threonine pr^sente dans HG1, ce mutant contient egalement une mutation 
du site EcoRI qui n'entraine pas d'alteration de la sequence peptidique. 

La presence de la mutation a ete confirmee par sequencage 
(protocole Sequenase 2.0, U.S. Biochemical Corp., Cleveland, HO). 
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2. Resultats 

2.L Le remplacement de Tisoleucine 747 par la threonine conduit a 
un decaiage de la courbe de reponse en fonction de la dose de 
dexamethasone pour la transactivation, sans affecter sensiblement 
Taffinite de liaison du ligand. 

On a compare les caracteristiques transcriptionnelles du hGR de 
type sauvage (TS) et d'un mutant dans lequel I'isoleucine 747 a ete 
remplacee par la threonine [designe ci-apres par GR(I747/T)]. Les 
recepteurs ont ete exprimds transitoirement dans des cellules CV-1 
exemptes de GR, conjointement avec un gene reporter de luciferase sous le 
controle du promoteur de I'aminotransferase de la tyrosine (pTAT-tk-Luc). 
La Figure 2 montre les courbes correspondantes de reponse en fonction de 
la dose de ligand utilis^e, permettant de determiner les valeurs de la CE50 
(la concentration de ligand donnant 50 % de la reponse transcriptionnelle 
maximale). La courbe de reponse en fonction de la dose pour hGR TS 
presente une reponse maximale a 10-8 M de Dex et une reponse egale a la 
moitte de la reponse maximale a 4x1 O^o M, alors que la courbe de reponse 
transcriptionnelle du mutant GR(I747/T) est nettement decalee vers les 
plus fortes concentrations de ligand, entrainant des valeurs 100 fois plus 
elevees de la CE 50 pour Dex (4x10-8 M) (voir tableau I ci-apres). La 
stimulation maximale mediee par GR(I747/T) a ete atteinte a environ 
lO^ M Dex. Toutefois, il est important de notcr que le recepteur GR(I747/T) 
est capable d'activer la transcription du pTAT-tk-Luc au meme degre que le 
GR TS. En consequence, le remplacement du residu isoleucine par la 
threonine a la position 747 ne diminue pas Taptitude du GR a activer la 
transcription mais a modifie specifiquement la sensibilite au ligand de la 
reponse. 

L'effet de cette mutation est independant de la region A/B 
N-terminale et de sa fonction de transactivation associee AF-1. Les mutants 
de delation depourvus de AF-1 mais contenant la mutation I747/T[AA/B- 
GR(I747/T)] necessitent 3x10-8 M de Dex pour une stimulation 
representant la moitie de la stimulation maximale, tandis que seulement 
6x10-10 m sont suffisants pour le AA/B-GR derive de TS (donnees non 
representees; voir egalement le tableau II pour les chimeres GAL 
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correspondantes). Ainsi, la mutation I747/T exerce un effet similaire sur le 
GR complet et le GR a deletion N-terminale. On peut en conclure que le 
decalage observe dans la reponse en fonction de la dose de ligand n'est pas 
la consequence d'une interaction modifiee entre AF-1 et AF-2. 
5 Pour determiner l'effet de la mutation I747/T sur la liaison dU 

ligand, on a mesure la liaison de Dex dans un cytosol de cellules Cos-7 
exprimant transitoirement le hGR mutant et le hGR de type sauvage. Les 
valeurs de Kd obtenues a partir d'une analyse de Scatchard sont tres 

semblables, puisque le mutant I747/T ne manifeste qu'une affinite pour la 

10 Dex deux fois plus faible que le GR TS (Figure 3). Ainsi, Tordre de grandeur 
du decalage des courbes dose-reponse vers les fortes concentrations de 
hGR (I747/T), par rapport au hGR TS (environ 100 fois) est peu susceptible 
de resulter d'une diminution d'affinite pour le ligand du hGR mute 
(facteur 2 seulement ; comparer les Figures 2 et 3). 

15 2.2. hGR(I747/T) ne repond pas aux ligands naturels 

Pour caracteriser davantage les caracteristiques de liaison du 
mutant I747/T, on en a compare Pactivation par divers agonistes 
synthetiques connus pour le GR TS (triamcinolone acetonide, RU28362, 
bimedrazol), un agoniste partiel (fluocinolone acetonide) et des 

20 glucocorticoids naturels (Cortisol, cortico-st6rone). Avec le recepteur 
mutant, le triamcinolone acetonide et le RU28362 donnent la meme 
transactivation qu'avec le recepteur de type sauvage, tandis que le 
bimedrazol et la fluocinolone acetonide ont manifeste une plus forte 
activite (tableau I). Pour tous ces analogues, le mutant 1747 /T manifeste un 

25 decalage de la courbe de reponse en fonction de la dose, en direction des 
plus fortes concentrations de ligand, bien que ce decalage soit moins 
prononce pour des ligands a forte affinite (tableau I). 

Les ligands naturels, tels que le Cortisol ou la corticosterone ou 
l'aldosterone, le ligand naturel du recepteur de mineralocorticoides, se 

30 lient au GR avec une plus faible affinite que Dex. Avec le GR de type 
sauvage, ces ligands sont aussi efficaces que la Dex pour stimuler le 
reporter de la luciferase (tableau I). Toutefois, en presence de ces ligands 
naturels, et en contraste notable avec les effets observes avec Dex, la 
transactivation par le mutant I747/T est fortement diminuee (Cortisol) ou 

35 supprimee (corticosterone, aldosterone). 
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2.3. Activites agonistes et antagonistes similaires de RU486 avec 
hGR de type sauvage et hGR mutant 

RU486 est un puissant inhibiteur de ^expression des genes 
dependant des glucocorticoides. En presence de cet antagoniste, la fonction 
AF-2 de GR est bloquee, mais on a pu observer une certaine activite 
agoniste dependant de AF-1 [(43) et references qui y sont contenues]. Une 
mutation ou une deletion de ia partie C-terminale du LBD peuvent alterer 
la reponse a des ligands agonistes/antagonistes, bien que les roles de AF-1 
et de AF-2 n'aient pas ete clairement definis dans les etudes rapportees 
(44-46). 

Pour tester l'affinite de liaison relative de RU486 pour le mutant 
I747/T et le type sauvage, on a examine Taptitude de RU486 a entrer en 
competition avec la Dex pour la liaison aux recepteurs. Des cellules 
transfectees avec hGR mutant ou TS ont 6te traitees par 10 nM de [3H]-Dex, 
une concentration suffisante pour engendrer essentiellement des 
recepteurs mutants et TS complexes avec la Dex, conformement aux essais 
de liaison de ligand in vitro (voir plus haut), et par des concentrations 
croissantes de RU486 (Figure 4) . On a obtenu des valeurs de la CI50 (la 

concentration d'antagoniste bloquant 50 % de la transactivation 
maximale) tres similaires pour les deux recepteurs (10-8M pour le hGR TS et 
6xlO-9M pour le hGR mutant). Ces resultats sont en accord avec les essais de 
liaison a Dex et montrent que les affinites de liaison a Dex et RU486 ne sont 
pas modifiees par la mutation I747/T. 

2.4. Le decalage de I'activite transcriptionnelle du recepteur 
mutant est independant du promoteur 

On a obtenu les resultats decrits ci-dessus dans des cellules 
transfectees, en utilisant un gene rapporteur contenant un fragment 
promoteur du gene TAT qui heberge deux elements de reponse aux 
glucocorticoides (GRE). Pour distinguer entre une modification des 
proprietes intrinseques de transactivation du recepteur et une 
modification de Tactivite cooperatrice resultant de la liaison de plusieurs 
molecules de recepteur, on a compare les activites transcriptionnelles du 
recepteur mutant GR(I747/T) et du recepteur de type sauvage, cn utilisant 
un promoteur synthetique contenant un seul GRE, palindromique et 
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parfait. Les courbes correspondantes de reponse en fonction de la dose 
presentent les memes profils que celles obtenues avec le promoteur TAT. 
La reponse correspondant a la moitie de la reponse maximale est obtenue a 
lOio m pour le GR TS et a 2x10-8 M pour GR(I747/T) (tableau II). Cela 
5 indique que le decalage observe avec le recepteur mutant reflete les 
proprietes de transactivation intrinseques du mutant GR(I747/T) et ne sont 
pas le resultat d'une alteration de la cooperation entre les recepteurs. 

Le remplacement du domaine de liaison d'ADN de GR par les 147 
premiers acides amines du transactivateur de Gal4 de levure donne une 

10 proteine activatrice hybride ayant une nouvelle specificite de promoteur. 
Les hybrides Gal4-GR consistent en le domaine de liaison d'ADN (DBD) de 
Gal4 (1-147) fusionne avec le LBD de hGR TS ou mutant. Leurs aptitudes a 
activer la transcription ont ete testees dans des essais de transfection 
transitoires dans des cellules HeLa. On a constate le meme decalage qu'avec 

15 le mutant GR(I747/T) complet (tableau II). Ces resultats montrent que le 
decalage de la reponse transcriptionnelle en fonction de la dose du ligand 
est independant de promoteur et d'element de reponse (RE). En outre, cet 
effet est apparemment non specifique des souches de cellules utilisees, 
comme on Pa constate £t la fois dans des cellules humaines HeLa et des 

20 cellules simiennes Cos. Pour exclure davantage une implication possible de 
facteurs se liant au promoteur tk ou R-globine du gene rapporteur (47) , on 
a utilise un gene rapporteur contenant un element de reponse Gal4 
precedant un promoteur minimal. Bien que la transactivation par la 
proteine chimerique Gal4 ait ete diminuee avec ce gene rapporteur 

25 minimal, on a encore pu observer un decalage de la courbe de reponse 
vers les doses croissantes pour la proteine chimerique mutante 
Gal4-GR(I747/T) (tableau II). 

2.5. Activite transcriptionnelle de recepteurs GR mutant et de type 
sauvage en reponse a la dexamethasone ( Figure 2). 

30 Des cellules CV-1 ont ete transitoirement transfectees avec 0,5 \xg de 

vecteurs depression de GR de type sauvage (0) ou de GR(I747T) (o), 2 t 5 \xg 
de pTAT-tk-Luc en tant que plasmide raporteur et 0,5 ng de pCMV-ftGal en 
tant que temoin interne. Apres la transfection, on a mis les cellules a 
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incuber pendant 24 heures avec des concentrations croissantes de Dex, et 
on les a ensuite soumises a un essai des activites ft-galactosidase ei 
luciferase, comme decrit dans "Materiels et Methodes". L'activitc 
luciferase a ete normalisee avec Tactivite ft-galactosidase, et la valeur 
5 obtenue en absence de ligand a etc soustraite pour chaque point. Les 
resultats ont 6te exprimes en pourcentage de 1'activite luciferase maximale 
obtenue pour chaque recepteur. Chaque point est la moyennc + ecart-type 
de la moyenne, de quatre determinations separees effectuees en double. 
Les analyses de liaison a saturation ont ete effectuees avec des cytosols 

10 provenant de cellules Cos- 7 transfectees avec 40 \ig de vecteur depression 
de hGR de type sauvage (D) ou de hGR(I747/T) (•), avec 20 \xg de 
pCMV-ftGal mis a incuber pendant une nuit i 4°C en presence de 
concentrations croissantes de [3H]-dexamethasone ± un exces de lOOx de 
Dex radio-inerte. Le steroide [3H] fixe a ete mesure apres traitcment au 

15 charbon enrobe de dextran. Les resultats representes sont ceux d f un seul 
essai effectue en double et representatif de trois essais separes. Les 
courbes de saturation de la liaison de [3H]-dexamethasone sont 
representees en pourcentage de la capacite de liaison maximale obtenue 
pour chaque recepteur. La capacite de liaison du mutant GR(I747/T) est 

20 diminuee pour atteindre environ 40-60 % de celle du hGR de type sauvage 

(623 ± 65 fmoles/mg de proteine, par rapport a 1 340 ± 285 fmoles/mg de 
proteine). 

2.6. Analyse de Scatchard de la liaison de [3] I] -dcxamethasone aux 
recepteurs de type sauvage et mutant I747/T (Figure 3). 
25 On a applique Tanalyse de Scatchard a la liaison effectuee comme 

decrit sur la Figure 2. La constante de dissociation apparente du mutant 
GR(1747/T) (o) n'est que deux fois plus elevee que celle du hGR de type 
sauvage (D) (K d =5,1 + 1,9 par rapport a 2,7 + 1,3 nM). 
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2.7. Tableau I 



Activites transcriptionnelles et CE50 de divers steroides avec hGR de type 
sauvage et hGR(I747/T) 



10 



15 





Activite luciferase % 




CE50 




Ligand 


Type 


hGR 


Type 


hGR 


%C1 




sauvage 


(I747/T) 

• 


sauvage 


(I747/T) 




Dexamethasone 


100 


100 


4x10" 10M 


4xl0-8M 100 


TA 


98 


102 


5xl0-i0M 


2xlO-8M 


40 


RU28362 


90 


88 


3xl0-i0M 


7xJ0-9M 


23 


Fluocinolone 


75 


100 


I,5xl0-10M 


3xlO-9M 


20 


Bimedrazol 


100 


180 


1O10M 


2xl0-9M 


20 


Cortisol 


110 


15 


7xl09M 


nm 




Corticosteroid 


100 


0 


7xl0-8M 


nm 




Aldosterone 


90 


0 


5xl0-8M 


nm 





20 Les co-transfections ont ete effectuees et les courbes de reponse en 

fonction de la dose ont ete construites comme decrit sur la Figure 2. On a 
teste a six concentrations croissantes, en double, le triamcinolone 
acetonide (TA), RU28362, le fluocinolone acetonide (fluocinolone), le 
Cortisol, la corticosterone et Taldosterone. Les essais de Tactivite luciferase 

25 et de la fi-galactosidase ont ete effectues comme decrit dans "Materiels et 
Methodes". Les moyennes de trois essais independants sont donnees dans 
ce tableau, nm = non mesurable. 

2,8- Competition des activites de liaison de Dex et dc transactivation 
par RU486 (Figure 4). 

30 Des cellules Cos-7 transfectees avec le hGR dc type sauvage (D) ou 

mutant I747T (•) ont ete mises a incuber pendant 1 heure a 37°C avec de la 
[3H]-dexamethasone 10 nM seule ou en presence de la concentration 
indiquee de RU486 non marque, comme decrit dans "Materiels et 
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10 



Methodes". Les donnees sont exprimees en pourcentage de la liaison 
specifique observee sur le temoin non soumis a la competition. Ces 
donnees representent la moyenne de determinations effectuees en double 
pour chaque concentration d'antagoniste. 

L'activite antagoniste a ete determinee sur des cellules CV-1 
transferees comme decrit sur la Figure 4 et traitees simultanement par 
Dex 10* 7 M et la concentration indiquee de RU486, 24 heures avant la recolte 
pour l'essai des activites luciferase et ft-galactosidase. 100 % d'activite sont 
definis pour chaque recepteur comme Tactivite luciferase des cellules 
traitees par la Dex seule. Chaque point represente la moyenne d'au moins 
deux essais independants effectues en double. (D): hGR de type sauvage; 
(o): mutant I747T. 

2-9, Tableau II 



15 



CE50 obtenue avec divers genes reporter 



Recepteur 



Gene rapporteur 



CE50 



20 



25 



30 



GR de type sauvage 

GR(I747/T) 

Gal4-GR 

Gal4-GR ( ,747/T) 
Gal4-GR 

Gal4-GR ( i747 /T) 



pGRE-tk-Luc 



p(17M) 5 -RGlob-Luc 



p(17M) 5 -tata-Luc 



10-10M 
2x10-8 M 

ijxia9M 

I,5xl0- 7 M 

2xl0"9M 

2xlO-7M 



Des cellules HeLa (pour les chimercs Gal4) ou des cellules CV-1 ont 
ete cotransfectees transitoirement avec divers vecteurs d'expression et 
genes reporter. L'efficacite de la transfection a ete standardisee en 
cotransfectant par 0,5 \ig de vecteur pCMV-Rgal. Les cellules ont etc 
traitees pendant 24 heures par des concentrations croissantes de 
dexamethasone. Les essais de la luciferase et de la ft-galactosidase ont ete 
effectues comme decrit dans "Materiels et Methodes". L'activite luciferase 
est exprimee en pourcentage de l'activite maximaie obtenue pour chaque 
recepteur et chaque gene reporter. Les valeurs de la CO50 ont ete 



35 determines graphiquement. 
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2.10. R6capitulatif 

La mutation de Tisoleucine 747 du recepteur humain des 
glucocorticoides en threonine resulte en une tres forte diminution, voire 
une abolition de Pactivite de transactivation du recepteur, en presence de 
5 glucocorticoides naturels, alors qu'a des concentrations similaires, des 
glucocorticoides synthetiques stimulent de fagon efficace 1'activite de 
transactivation de ce recepteur mute. 

II est important de souligner que hGR(I747/T) repond totalement a 
une forte concentration de Dex, ce qui indique qu'il peut en principe 
10 transactiver aussi efficacement que sa contrepartie de type sauvage. En 
consequence, la fonction d'activation transcriptionnellc de AF-2 
elle-meme n'est apparemment pas alteree par la mutation, comme c'est le 
cas pour des recepteurs comportant des mutations dans la partie centrale 
de AF-2 (voir Introduction pour les references). 
15 3. Materiels et methodes 

3.1. Cultures cellulaires et transfection 

Les cellules CV-1 et Cos-7 ont ete cultivees dans du milieu d'Eagle 
modifie par Dulbeco (DMEM) contenant 10 % (v/v) de serum de veau foetal 
(SVF) (Gibco, Grand Island, NY), dans une atmosphere humidifiee 
20 contenant 5% de CO2. Les cellules HeLa ont ete cultivees dans les memes 

conditions. Les transfections transitoires ont ete effectuees dans des 
multi-plaques a 6 puits, selon le mode operatoire au phosphate de calcium 
deja decrit (42). Un plasmide recombinant de reference, pCMV-BGal, 
exprimant la ft-galactosidase bacterienne, a ete transfecte conjointement 

25 avec le vecteur d'expression du recepteur et 1c g6ne reporter 
correspondant, afin de corriger d'eventuelles variations de Tefficacite de 
la transfection. Le precipite a ete elimine par lavage au bout de 24 heures, 
et les cellules ont ete maintenues dans du DMEM sans SVF mais contenant 
de Thormone. Au bout d'encore 24 heures, les cellules ont ete rincees et 

30 lysees pendant 15 minutes avec 0,3 ml de tampon de lysc [Tris.phosphate 
25mM, pH 7,8, MgCl 2 8 mM, 1% de Triton X100, 10 % de glycerol (48)]. 

L'activite luciferase correpondante a ete determinee sur unc fraction 
aliquote (0,1 ml), par evaluation du pic de luminescence (pour un temps 
d'integration de 15 secondes), aprcs injection de 0,1 ml de luciferinc 1 mM 
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dans un luminometre LKB. La ft-galactosidase a etc determinee par la 
methode modifiee par Bocquel et al. (49), pour le controle de l'efficacite de 
chaque transfection. 

3.2. Plasmides utilises 

Les GR a deletion N-terminale, AA/B-GR ou AA/B-GR5I747/T), qui 
exprimaient seulement les acides amines 368 a 777, ont ete obtenus a partir 
du fragment de digestion Pstl-P/7Ml du vecteur d'expression HGO ou 
pGR(I747/T), respectivement, ligature dans les sites correspondants de HG8 
(49). Le plasmide pGAL-GR (don de T. Lerouge) etait constitue du domaine 
de liaison a l'ADN de la proteine Gal4 de levure (aal-147) et du domaine de 
liaison a une hormone de GR (a500-777); pGal-GR(1747/T) a ete construit 
par insertion de la mutation dans pGal-GR. 

Le gene reporter pTAT-tk-Luc a ete fourni par D. Gagne et a ete 
construit comme suit: on a d'abord engendre un plasmide intermediate 
pTAT, par insertion du segment EcoRl-BamHI de 966 pb, provenant de 
pKT53l [fourni gracieusement par T. Grande (50)] dans les sites 
correspondants du vecteur pUC19 (Pharmacia). Le fragment contenant la 
sequence codant pour la luciferase de luciole et le promoteur minimal 
thymidine kinase (tk) provenant du virus Herpes simplex a ete isole sous 
forme d'un fragment BamHl a partir de pvit-tk~Luc (51) et insere, en aval 
du promoteur TAT, dans le site correspondant de pTAT. Le plasmide 
reporter pGRE-tk-Luc a etc construit par ligature du fragment de digestion 
Hindlll-Bglll de pGRE-tk-CAT (52), qui contient un GRE synthetique 
(AGAACAcagTGTTCT) en amont du promoteur minimal tk, dans les sites 
Hindlll-Bglll de pLuc (53). Le gene reporteur p(17M) 5 -fiGlob-Luc a ete 
decrit precedemment (54). Le plasmide reporter p(17M) 5 -tata-Luc a ete 
construit a partir du plasmide p(17M) 5 -tata-CAT (55) par digestion par 
XhoI-BamHI et isolement du fragment contenant (17M 5 )-tata. Ce fragment 
a ete ensuite insere dans le vecteur pGL 2 (Promega) digere par les memes 
enzymes de restriction. 

Le vecteur depression de la ft-galactosidase pCMV-ftGal contient la 
sequence codant pour la R-galactosidase, sous controle du puissant 
promoteur constitutif de cytomegalovirus (CMV). 
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3.3. Essai de liaison a une hormone 
Des cellules Cos-7 transferees avec pCMV-RGal et hGR de type sauvage ou 
mutant I747/T ont ete recoltees 48 heures apres la transfcction, dans une 
solution salee tamponnee au phosphate (STP), par grattage a l'aidc d'une 
5 spatule en caoutchouc, Les cellules ont ete lavees deux fois dans de la STP 
glacee. Toutes les etapes de la preparation de cytosols ont ete effectuees a 
4°C. On a remis les cellules en suspension dans 3 volumes de tampon de 
liaison [Na-HEPES 20 mM, pH 7,3, molybdate de sodium 20 mM et EDTA 5 mM 
(22)] et avec des inhibiteurs de protease [leucopeptine (5 ng/ml), 

10 aprotinine (5 ng/ml), PMSF (40 ng/ml) et pepstatine A (5 jig/ml)], et on les 
a placees pendant 15 minutes sur de la glace. Les cellules ont ensuite 6te 
lysees par 30-40 coups de piston dans un homogeneisateur en verre 
Dounce, et Thomogenat resultant a ete ensuite centrifuge a 110 000 g 
pendant 30 minutes. Le surnageant, denomme cytosol, a etc utilise 

15 immediatement pour Tessai de liaison a une hormone. Les concentrations 
de proteine ont ete determinees par le dosage de proteine Bio-Rad (Bio-Rad 
Laboratories, Hercules, CA, USA). Pour 1'essai de liaison a une hormone, on 
a mis a incuber pendant une nuit a 4°C un cytosol, contenant 1-3 mg de 
proteine/ml, avec de la [3H]-Dex (49 Cl/mmole; Radiochemical Center, 

20 Amersham, Angleterre) ou du Cortisol (67 Ci/mmole; Radiochemical 
Center, Amersham, Angleterre) sans (liaison totale) ou avec (liaison non 
specifique) un exces de 100 fois de compose radio-inerte (10" 5 M, Sigma 
Chemical Co., St. Louis, Mo, USA). On a ensuite traite les echantillons par 1 
volume de charbon-dextran (5% de charbon, 0,5% de dextran dans la 

25 solution de liaison) pendant 15 minutes dans de la glace, sous agitation 
constante, puis on les a soumis a une centrifugation pendant 10 minutes & 
12 000 g. Le ligand [3H] fixe a ete mesure dans une partie aliquote du 
surnageant, par comptage de scintillation. La constante de dissociation a 
Tequilibre (Kd) du recepteur pour la dexamethasone ou le Cortisol a ete 

30 determinee par analyse de Scatchard. 

Pour Tanalyse de liaison competitive, on a mis les cytosols a incuber 
avec 10 nM de [ 3 H]-Dex et diverses concentrations de steroides competitifs 
non radioactifs, dans les memes conditions que preccdemment. Apres 
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traitement au charbon-dextran et comptage de scintillation, la liaison 
specifique a ete exprimee en pourcentage du temoin non soumis a une 
competition, et portee en fonction de la concentration du steroide en 
competition. Des essais de liaison competitive dans des cellules entieres ont 
5 6te effectues sur 106 cellules mises a incuber pendant 1 heure a 37°C avec 
10 nM de [3H]-Dex et diverses concentrations de steroides en competition. 
Apres sonication dans 1 ml de tampon KG (EDTA 1,5 mM, Tris.HG 20 mM, pH 
7,4, KG 0,5 M), on a elimine le steroide non lie par addition de deux 
volumes de charbon enrobe de dextran, dans du tampon KG a la gelatine 
10 (0,05 % de dextran, 0,5% de charbon, 0,1% de gelatine). On a mis le melange 
a incuber pendant 30 minutes a 4°C et on l ! a centrifuge a 3 000 g pendant 
5 minutes. La radioactivite a ete determinee par comptage de scintillation 
en liquide et on a porte sur une courbe comme precedemment la liaison 
specifique. 

15 

EXEMPLH 2 : Recombinase Cre chimerique dont Pactivite est 
inductible par des glucocorticoides synthetiques, mais pas par des 
glucocorticoides naturels 

L Materiel et methodes 

20 1.1. Construction du vecteur pCre-LBD[GR(I747/T)] 

Un fragment d'ADN Clal-Xbal d'environ 1300 paires de base (pb), 
contenant la sequence codant pour le domaine de liaison du ligand du 
recepteur humain des glucocorticoides a etc isole du plasmide HG1 (voir 
Exemple 1 (40)) et ses extremites ont ete remplies par la T4 polymerase. Ce 

25 fragment a ete mute de sorte que les nucleotides ATT codant pour une 
isoleucine en position 747 du recepteur sauvage (56) sont remplaces par 
les nucleotides ACC, codant pour une threonine. Ce fragment mute a ete 
clone dans le vecteur pCre-ER (28) digere par Xhol et Pstl, dont les 
extremites ont egalement ete remplies par la T4 polymerase [plasmide 

30 pCre+GR(I747/T)+F; sequence codante du LBD de hGR(1747/T) dans la meme 
orientation que celle de Cre]. pCre-LBD[GR(I747/T)] a ete obtenu par 
mutagenese dirigee realisee sur PADN simple brin prepare a partir du 
plasmide pCre + GR(I747/T) + F, avec les oligonucleotides de synthese : 
- SG52 ( 5 -CTGG AAG ATGGCGATCTCG AGATTCAGCAGGCC ACT-3 ' ) 

35 - SG53 (5* -CTGTTTCATCAAAAGGGTACCAGCCGTGGAGGGGCAT- 3') 



ft 
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permettant de fusionner d'une part la sequence d'ADN codant pour la Cre 
[amino acides (aa) 1-343 (orf2 (cre) ; (31)], et celle qui code pour la region 
contenant le LBD mute de HG1 [aa 500-777], d'autre part la sequence d'ADN 
precedemment modifiee et celle codant pour la region F du recepteur 
5 humain des oestrogenes (ER) [aa 553-595 (57)] (Figure 5). Cette operation 
restaure le site de restriction Xhol situe a la fin des sequences Cre dans 
pCre-ER et introduit un site de restriction Kpnl entre les sequences codant 
pour GR et la region F du ER (Figures 6 et 7). 

1.2. Mutation du gene RXRa 

10 Le vecteur (pRXRatLNU), utilise pour muter le gene RXRa (58) par 

recombinaison homologue dans les cellules F9 a ete construit de la facon 
suivante : 

Un phage X contenant un fragment genomique de 11.8 kb, 
comprenant les exons 2,3 et 4 de RXRa, a etc isole a partir d'une banque 

15 genomique realisee avec de l'ADN genomique de Pembryocarcinome 
murin PI 9, clone dans le vecteur k EMBL3. Un fragment Sail isole de ce 
phage (dont les extremites ont ete remplies par la T4 polymerase) a ete 
sous clone dans le site BamHI (apres traitement a la T4 polymerase) d'un 
derive du vecteur pBluescriptIISK+ (Stratagene). Dans ce derive, le site 

20 Xhol a ete supprime. Un site Xhol a ete introduit dans I'exon 4 de RXRa au 
niveau du site Accl correspondant au nucleotide 535 de l'ADNc de RXRa (la 
sequence de TADNc de RXRa est donnee dans Genbank reference : M 
84817), en clonant dans le site Accl les oligonucleotides synthctiques 
suivams : 

25 - 5 ATTATTATr ACTCG AGTGATG ATG-3 ' et, 

- 5 ATC ATC ATC ATCCG AGTAATAATA-3 ' . 

Enfin, le fragment Xhol, contenant la cassette d'expression du gene de 

resistance a la neomycine, entouree de sites loxP, isole du vecteur pHR56 

(28) a ete clone dans le site Xhol du vecteur precedent. 
30 La mutation d'un allele du gene RXRa dans des ellules F9 a ete 

effectuee par recombinaison homologue a l'aide du vecteur pRXRa(LNL) 

(28). Cette lignee a etc appelee RXRa^MLNL). 

1.3. Expression de Cre-LBD[GR(1747/T)] dans des cellules comportant 
un fragment d'ADN modifie : RXRa(LNL) 



* 
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■ Transfection transitoire : 5. 10& cellules RXRa +/ -(LNU Q u cellules 
HeLa resuspendues dans 500 nl de PBS ont ete electroporees avec 5 yg de 
plasmide pCre-LBD[GR(I747/T)] [eventuellement cotransfectees avec 5 \ig 
du vecteur pRXRa^ 1 ) pour les cellules Hela] a l'aide d'un electroporateur 
5 (Bio-Rad gene pulser), regie a 200 V et 960 \xF. Les cellules ont ensuite ete 
ensemens£es a 10 6 cellules par boite de 100 mm et traitees, si n^cessaire, 
avec des ligands. 

- Transfection stable : 5. 10 6 cellules RXRa+z-fLNL), resuspendues dans 
500 ^il de PBS ont ete electroporees avec 5 ng de pCre-LBD[GR(I747/T)] et 
10 1 \ig de pPGK-Hyg (59), digeres respectivement par Sail et PvuII, a Paide 
d'un electroporateur (Bio-Rad gene pulser), regie a 200 V et 960 ^F. Les 
clones resistants ont ete obtenus selon la procedure decrite par Metzger et 
al. (28). 

1.4. Amplification par "PCR" d'une region d'ADN genomique 
15 localisee dans 1'exon 4 de RXRa 

Les amplifications d'ADN ont ete realisees en utilisant la technique 
de "Polymerase Chain Reaction" (PCR), selon le protocole decrit par Chen 
and Evans (60). Les amorces utilisees sont : SB211 et PZ105, ayant 
respectivement comme sequence nucleotidique 5 , -GGCAAACACTATGG-3' et 
20 5 , -TTGCGTACTGTCCTCTT-3 \ Apres denaturation pendant 8 min a 94°C, 2,5 
unites de Taq polymerase sont ajoutees. L'amplification est effectuee en 
realisant 35 cycles (30 sec. a 94°C, 30 sec. a 50°C) suivi d'un cycle (30 sec. a 
94°C, 30 sec. a 50°C, 5 min a 72°C) dont le produit est conserve a 4°C 

Les produits des reactions ont ete separes sur gel de polyacrylamide 
25 (10 %) ou d'agarose (2,5%). L'ADN a ete visualise par UV suite a une 
coloration au bromure d'ethidium, ou par Southern Blot (42). 

1.5. Test d'excision des sequences situees entre les sites LoxP 
L'ADN de cellules RXRa + / -(LNL) ( transfectees avec pCre- 

LBD[GR(I747/T)] ou le vecteur parental pSG5, non traitees ou traitees avec 
30 du Cortisol (10-%1) ou de la dexamethasone (10-&M) pendant 72 heures, a ete 
soumis a une reaction PCR selon la strategic decrite en Figure 8. Les 
produits de la reaction ont ete separes sur gel d r acrylamide et colores au 
bromure d'ethidium. La piste M sur la Figure 9 correspond au depot du 
marqueur de taille pBR322 digere par Hinfl. La position des alleles sauvage 
35 et recombine est indiquee. 
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1.6. Analyse par PGR de l'activite recombinase de Cre- 
LBD[GR(I747/T)] dans la lignee RXRa+/-aNU cxprimant la proteine 
chimerique de facon constitutive. 

Pour la Figure 10, l'ADN prepare a partir de cellules RXRa +/ - 
5 (LNU:Cre-GR(I747/T) non traitees ou traitees au Cortisol (10-&M) ou a la 
dexamethasone (10* 6 M) a servi de matrice pour realiser une amplification 
par PCR, selon la procedure decrite en Figure 8. L'ADN amplifie a ete 
separe sur gel d'acrylamide et colore au bromure d'ethidium. Les pistes 1, 
2, 3 et 4 contiennent respectivement les produits de PCR realises avec de 
10 l'ADN extrait de cellules F9 sauvages (WT), RXRa+'-aNU, RXRa+'-(U et de 
C2RXRa-(L)/-(U (73). La piste 8 contient un marqueur de taille (echelle de 
lkb ; GibcoBRL). 

Sur la Figure 11, l'ADN prepare a partir de cellules RXRa+'-fLNUiCre- 
GR(I747/T) non traitees ou traitees avec de Taldosterone, du Cortisol, de la 

15 corticosterone, de la dexamethasone, de la triamcinolone acetonide ou du 
RU486, a des concentrations allant de 10-9 a 10-6M, a servi de matrice pour 
realiser une amplification par PCR, selon la procedure decrite en Figure 8. 
L'ADN amplifie a ete separe sur gel d 'agarose et analyse selon la technique 
de Southern. Les fragments amplifies correspondant aux alleles sauvage et 

20 recombine ont £te detectes par hybridation a Taide de Poligonucleotide de 
synthese (S'-AAGAAGCCCTTGCAGCCCTC-S'), radiomarque a Textremite 5' par 
de la T4 polynucleotide kinase. Le signal a ete visualite et quantifie a 1'aide 
d'un "phospho-imager" (Fujix bas2000). 

Pour la Figure 12, des cellules RXRa^(LNU : Cre-GR(I747/T) ont etc 

25 cultivees pendant 72 h dans du milieu de culture auquel ont ete ajoutes 
trois ligands naturels (Taldost^rone, le Cortisol et la corticosterone) a la 
concentration de 10*9 M ou 10 - 8 M et de la dexamethasone (10-' ou 10-6 M) 
comme indique. L'allele recombine a ete detecte selon la procedure decrite 
en Figure 8. L'ADN amplifie a ete separe sur gel d'agarose et analyse selon 

30 la technique Southern. Les fragments amplifies correspondant a l'allele 
recombine ont ete detectes par autoradiographic, suite a une hybridation 
avec Toligonucleotide de synthese 

5'-AATTATAACTTCGTATAATGTATGCTATACGAAGTTATTC - 3\ (contenant un 
site loxP) radiomarque au Phosphore 3 2 a I'extremite 5 r par la T4 
35 polynucleotide kinase. 
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Pour la Figure 13, des cellules HeLa onr ete cotransfectees par les 
plasmides pRXRad-NU et p Cre-LBD[GR(I747/T)], puis cultivees pendant 
72 heures avec ou sans addition des ligands indiques, a la concentration de 
10~ 7 M. L'ADN de ces cellules a ensuite ete soumis a une amplification PCR 
5 selon la strategic decrite. Les produits de la reaction ont ete separes sur gel 
d'acrylamide et colores au bromure d'ethidium. La piste 1 correspond au 
depot du marqueur de taille 1 kb ladder (echelle de lkb, GibcoBRL). 

2. Resultats 

Afin d'exprimer une recombinase Cre dont Pactivite soil inductible 

10 par des ligands synthetiques du recepteur des glucocorticoTdes, mais non 
par des ligands glucocortico'ides naturels aux concentrations 
"physiologiques", on a construit un vecteur d'expression, pCre- 
LBD[GR(I747/T)], derive du vecteur pCre-ER (28) en remplacant la 
sequence d'ADN codant pour les acides amines 344-618 contenant le LBD du 

15 recepteur des oestrogenes (RE), par celle codant pour les acides amines 
500-777 d'un recepteur des glucocortico'ides (GR) mute contenant le 
domaine de liaison (LBD) mute du GR(I747/T). La construction de ce 
plasmide a conduit a Pinsertion de la sequence GGTACC, codant pour les aa 
Gly-Thr en position 624-625 de Cre-LBD[GR(I747/T)] (Figure 7). 

20 L'activite recombinase de Cre-LBD[GR(I747/T)] a ete testee dans une 

lignee cellulaire murine RXRa+'MLNL). Cette lignee a ete obtenue en 
integrant par recombinaison homologue le gene TK-nco, encadre de sites 
loxP (en repetition directe) (LNL), dans Pexon 4 d'un allele du gene RXRa 
(28). Le gene TK-neo est un gene chimerique pcrmettant Pexpression 

25 d'une proteine de fusion thymidine kinase/gene de resistance a la 
neomycine. L'electroporation de cette lignee avec le vecteur pCre- 
LBD[GR(I747/T)] a permis d'evaluer son activite recombinase sans ajout de 
Hgand, ou apres addition de Cortisol (ligand naturel) ou de dexamethasone 
(Figure 9) (Dex ; ligand synthetique). L'ADN des cellules ainsi traitees est 

30 en effet soumis a une PCR avec des oligonucleotides synthetiques localises 
dans Pexon 4, Pun en amont du site AccI, Pautre en aval de ce site. La taille 
des fragments PCR obtenus avec cette paire d'oligonucleotides, est de 65 pb 
pour Pallele sauvage, de 3345 pb pour Pallele mute (apres integration de 
LNL) et de 191 pb pour Pallele recombine (apres excision des sequences 
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situees entre les deux sites lox et d'un des sites lox, voir figure 8). Suite a 
un traitement des cellules transfectees a la dexamethasone (10-6 M), un 
fragment de 191 pb est observe, refletant la presence de sequences 
correspondant a Tallele recombine, alors qu'en l'absence de traitement ou 
suite a un traitement au Cortisol (10& M), aucun fragment de cette taille 
n'est observe. Ces resultats montrent done que l'activite recombinase de la 
proline de fusion etudiee peut etre induite en traitant des cellules 
exprimant cette proteine avec un ligand synthetique du GR tel que la 
dexamethasone mais pas avec un ligand naturel tel que le Cortisol, a la 

concentration de 10 6 M. 

On a egalement etabli une lignee RXRa +/ -<LNU exprimant de facon 
constitutive Cre-LBD[GR(I747/T)], en cointegrant la cassette depression 
du gene Cre-LBD[GR(I747/T)] avec un vecteur exprimant le gene de 
resistance a l'hygromycine (RXRa+'-<LNU : Cre-GR(1747/T) ; voir "Materiel 
et Methodes" ; donnees non presentees). L'activite recombinase a ete testee 
suite a un traitement de ces cellules avec de la Dex (lO&M) pendant 72 
heures. L'analyse des produits des PCR effectuees sur TADN de ces cellules 
revele un fragment de 191 pb correspondant a Tallele recombine 
uniquement apr^s traitement a la Dex (Figure 10). 

Ainsi, il est montre que Cre-LBD[GR(I747/T)] est inactive sans ajout 
de ligand ou en presence de Cortisol a 10~ 6 M, mais active en presence de 
Dex, lorsque sa cassette d'expression est integree dans le genome. 

On a egalement evalue la cinetique d'action de la recombinase : son 
activite est detectable des 12h de traitement a la dexamethasone a lO-^ M, 
mais elle est beaucoup plus forte apres 72h de traitement (resultats non 
presentes). 

L'activite recombinase de Cre-LBD[GR(I747/T)] a aussi ete testee 
suite a l'addition de differentes concentrations de ligands. Aucune activite 
recombinase n'a pu etre observee dans les cellules RXRa +/ -< LNL ):Cre- 
GR(I747/T) traitees a l'aldosterone, a: Cortisol ou a la corticosterone 
(concentration des ligands allant de 10^ . 10-^ M), alors qu'en presence de 
dex, de triamcinolone acetonide ou de RU486, une activite recombinase est 
observee des 10~ 9 M (Figure 11). 
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On a egalement montre a l'aide de cette lignee cellulaire que 
l'activite recombinase de Cre-LBD[GR(I747/T)] peut etre induite par des 
ligands synthetiques, meme lorsque les cellules sont cultivees en presence 
de ligands naturels (aldosterone, Cortisol et corticosterone) a 10*9 ou 10» M. 
5 L'excision de sequences localisees entre les sites loxP est obtenue suite a 
un traitement de 72h a la dexamethasone a lO 7 M ou 10 M (Figure 12). 

L'activite recombinase de Cre-LBD[GR(I747/T)] a enfin ete testee 
dans des cellules humaines : des cellules HeLa ont ete cotransfectees 
transitoirement avec les vecteurs pCre-LBD(GR(I747/T)] et pRXRa(LNU, 

10 puis cultivees soit sans ajout de ligand, soit en presence des ligands 
indiques sur la Figure 13. Comme dans les cellules F9, une bande de 191 pb, 
correspondant au fragment recombine, est amplifiee a partir d'ADN isole 
des cellules traitees avec des ligands synthetiques (Dexamethasone, 
Triamcinolone acetonide ou RU486 a 10* 7 M), alors que sans ajout de ligand, 

15 ou en presence de ligands naturels tels que Paldosterone, la corticosterone 
ou le Cortisol aux memes concentrations, seul le fragment correspondant a 
Tallele sauvage peut etre detecte. 

Ces resultats montrent done que l'activite recombinase de la 
proteine de fusion Cre-LBD[GR(I747/T)] est induite par des ligands 

20 synthetiques du recepteur des glucocorticoids, alors qu'elle est insensible 
aux ligands naturels tels que le Cortisol, la corticosterone ou Taldosterone, 
meme a des concentrations aussi elevees que 10~ 6 M. De plus, la presence de 
ligands naturels n'empeche pas Tinduction de Tactivite recombinase de 
Cre-LBD[GR(I747/T)] par les ligands synthetiques. 

25 

EXEMPLE 3 : Induction de l'activite d'une recombinase Cre 
chimerique chez la souris 

L Materiel et Methodes 

1.1. Construction de plasmides et etablissement de souris 
30 transgeniques 

Le vecteur pCMVCre-LBD[GR(1747/T)] a ete construit en clonant le 
fragment EcoRI de 2 kb isole de pCre-LBD[GR(1747/T)l dans le site EcoRI de 
pMGSVl (60). Le fragment PvuII de 4,64 kb isole de 
pCMVCre-LBD[CR(I747/T)] a ete injecte dans des zygotes Fl (C57BL/6 X SJL) 
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a une concentration de 4 ng/jil afin de produire des souris transgeniques 
selon la procedure classique (61). 

1.2. Conditions de PCR 

Les amplifications par PCR ont ete realisees dans une solution 
tampon contenant 10 mM Tris-HCl (pH = 8.8), 50 mM KC1, 1,5 mM MgC12. 
0,2 mM dNTPs, 0,25 nM de chaque amorce, 2 unites de Taq polymerase et 
1 ng d'ADN genomique comme matrice. Apres 30 cycles (30 sec a 94°C, 
30 sec a 55°C, 1 min a 72°C) puis 1 cycle (30 sec a 90°C, 30 sec a 55°C, 5 min a 
72°C), les produits d'amplification ont £te s^pares sur gel d'agarose a 2.2 % 
colore au bromure d'ethidium. 

1.3. Analyse du genotype des souris. 

Le transgene Cre-LBD[GR(I747/T)] et les alleles de type sauvage et 
excise RXRcxaaF2<lnl) ont ete d<§tect<§s par PCR. La detection du transgene 
Cre-LBD[GR(I747/T)] a ete effectuee a l'aide des amorces nucleotidiques 
5 '-ATCCGAAAAGAAAACGTTGA-3 ' et 5 '-ATCCAGGTTACGGATATAGT-3 ', celle des 
alleles du gene RXRa grace aux amorces S'-GGTTCrcCGGCCGCTTGGGT-S' et 
5-GAAGGCGATGCGCTGCGAAT-3'. De la meme facon, l'cxcision du marqueur 
tk-neo encadre de sites loxP a ete suivie par PCR a l'aide des amorces A 
( 5 '-CAAGGAGCCTCCTTTCTCTA-3 ') et B ( 5 '-CCTGCTCTACCTGGTG ACTT-3 ') . Ces 
amorces amplifient un fragment d'ADN de 156 paires de bases a partir de 
I'allele de type sauvage et un fragment de 190 paires de bases a partir dc 
Tallele excise RXRaAAF2(L). 

2. Resultats 

L'activite recombinase de Cre-LBD[GR(I747/T)] a egalement ete 
testee chez la souris. Ainsi, des souris transgeniques exprimant la proteine 
de fusion Cre-LBD[GR(I747/T)] sous le controle du promoteur du gene 
"major IE" du cytomegalovirus human ont ete etablics. La structure du 
transgene est representee a la figure 14a. II contient les sequences 
activatrices/promotrices du gene "major IE" du cytomegalovirus humain, 
un intron du gene de la p-globine de lapin, les sequences codantes de 
Cre-LBD[GR(I747/T)] et le signal de polyadenylation du virus simien SV40. 
Le site d'initiation de la transcription est indique par une fleche. Ces 
souris ont ensuite ete croisees avec des souris 'reporter', afin d*y 
demontrer Texistence d'une activite recombinase induiie. Cette lignee 
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'reporter' contient une insertion du marqueur de selection tk-neo, 
encadre de sites loxP, dans l'intron situe entre les exons 8 ei 9 du gene 
RXRa, sur Tun de ses deux alleles [RXRaAAF2(LNU]. Apres recombinaison du 
marqueur tkneo, un site loxP reste en place et constitue 1'allele excise 
RXRaAAF2(L). L'allele RXRa de type sauvage et 1'allele excise peuvent etre 
detectes simultanement par amplification PCR en utilisant une paire 
d'amorce appropriee A et B. La figure 14b represente schematiquement 
cette strategie PCR par indication des amorces A et B ainsi que de certains 
sites de restriction. 

Les descendants issus du croisement de souris Cre-LBD[GR(I747/T)] 
et de souris 'reporter', decrites ci-dessus, contenant a la fois le transgene 
Cre-LBD[GR(I747/T)] et 1'allele RXRa AA F2(LN L) ( C nt ete identifies en 
etablissant leur genopype a partir d'une biopsie de queue. Une de ces 
souris a subi a Tage de quatre semaines une injection intraperitoneale 
quotidienne de 0.3 mg de dexamethasone diluee dans 100 nl d'huile 
vegetale, pendant cinq jours. Une biopsie de queue a £te prelevee le jour 
avant la premiere injection, ainsi que le lendemain de la cinquieme 
injection. L'ADN isole a partir de ces prelevements a ete analyse par PCR ii 
l'aide des oligonucleotides A et B (figure 15, pistes 2 et 3) pour determiner 
si le traitement induit la deletion du marqueur tk-neo. La piste 1 
correspond a une reaction controle, realisee sans ADN. La position des 
produits de PCR amplifies a partir de Tallele RXRa de type sauvage et de 
1'allele excise RXRaAAF2(L) sonl indiques. Le marqueur de taille (piste 4) 
correspond a l'echelle de 1 kb (GibcoBRL). La taille des fragments est 
donnee en paires de bases. D'apres la figure 15, Texcision induite a bien eu 
lieu apres traitement de la souris testee a la dexamethasone. En effet, 
l'analyse des fragments d'ADN amplifies a partir de la queue avant 
traitement ne revele que la presence de Tailzie RXRa de type sauvage, 
alors que l'analyse de la queue de la meme souris, apres traitement, 
indique la presence de 1'allele excise RXRqaaf2(lnd (figure 15). Ainsi, il 
apparait que la recombinase chimerique Cre-LBD[GR(I747/T)] ne presente 
aucune activite constitutive de base en presence des ligands endogenes. 
Elle est cepedant induite et active chez la souris par un traitement a la 
dexamethasone. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: ASSOCIATION POUR LE DEVELOPPEMENT DE LA 

RECHERCHE GENETIQUE MOLECULAIRE (ADEREGEM) 

(B) RUE: 26 RUE MONTPENSIER 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75001 

(ii) TITRE DE L' INVENTION: RECEPTEUR NUCLEAIRE DE GLUCOCORTICOIDS 
MODIFIE, PROTEINS DE FUSION, FRAGMENTS D ' ADN CODANT POUR LEDIT 
RECEPTEUR ET LADITE PROTEINE DE FUSION, VECTEURS, CELLULES ET ANIMAUX 
EN COMPRENANT ET PROCEDES DANS LESQUELS ILS SONT MIS EN OEUVRE 

(iii) NOMBRE DE SEQUENCES: 17 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC- DOS /MS- DOS 

(D) LOGICIEL: Patentln Release #1.0, Version 81.30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2334 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: GR(I747/T) (Recepteur humain des glucocort icoides 

mute en position 747) 

(3) EMPLACEMENT : 1 . . 2331 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 777 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

ATG GAC TCC AAA GAA TCA TTA ACT CCT GGT AGA GAA GAA AAC CCC AGC 4 3 

Met Asp Ser Lys Glu Ser Leu Thr Pro Gly Arg Glu Glu Asn Pro Ser 
1 5 10 15 



AGT GTG CTT GCT CAG GAG AGG GGA GAT GTG ATG GAC TTC TAT AAA ACC 
Ser Val Leu Ala Gin Glu Arg Gly Asp Val Met Asp Phe Tyr Lys Thr 

20 25 30 



96 



CTA AGA GGA GGA GCT ACT GTG AAG GTT TCT GCG TCT TCA CCC TCA CTG 14 4 

Leu Arg Gly Gly Ala Thr Val Lys Val Ser Ala Ser Ser Pro Ser Leu 

35 40 45 



WO 97/31108 



48 



PCT/FR97/00315 



GCT GTC GCT TCT CAA TCA GAC TCC AAG CAG CGA AGA CTT TTG GTT GAT 
Ala Val Ala Ser Gin Ser Asp Ser Lys Gin Arg Arg Leu Leu Val Asp 
50 55 60 

TTT CCA AAA GGC TCA GTA AGC AAT GCG CAG CAG CCA GAT CTG TCC AAA 
Phe Pro Lys Gly Ser Val Ser Asn Ala Gin Gin Pro Asp Leu Ser Lys 
65 70 75 80 

GCA GTT TCA CTC TCA ATG GGA CTG TAT ATG GGA GAG ACA GAA ACA AAA 
Ala Val Ser Leu Ser Met Gly Leu Tyr Met Gly Glu Thr Glu Thr Lys 

85 90 95 

GTG ATG GGA AAT GAC CTG GGA TTC CCA CAG CAG GGC CAA ATC AGC CTT 
Val Met Gly Asn Asp Leu Gly Phe Pro Gin Gin Gly Gin He Ser Leu 

100 105 110 

TCC TCG GGG GAA ACA GAC TTA AAG CTT TTG GAA GAA AGC ATT GCA AAC 
Ser Ser Gly Glu Thr Asp Leu Lys Leu Leu Glu Glu Ser He Ala Asn 
115 120 125 

CTC AAT AGG TCG ACC AGT GTT CCA GAG AAC CCC AAG AGT TCA GCA TCC 
Leu Asn Arg Ser Thr Ser Val Pro Glu Asn Pro Lys Ser Ser Ala Ser 
130 135 140 

ACT GCT GTG TCT GCT GCC CCC ACA GAG AAG GAG TTT CCA AAA ACT CAC 
Thr Ala Val Ser Ala Ala Pro Thr Glu Lys Glu Phe Pro Lys Thr His 
145 150 155 160 



192 



240 



283 



336 



384 



432 



480 



TCT GAT GTA TCT TCA GAA CAG CAA CAT TTG AAG GGC CAG ACT GGC ACC 528 
Ser Asp Val Ser Ser Glu Gin Gin His Leu Lys Gly Gin Thr Gly Thr 

165 170 175 

AAC GGT GGC AAT GTG AAA TTG TAT ACC ACA GAC CAA AGC ACC TTT GAC 57 6 

Asn Gly Gly Asn Val Lys Leu Tyr Thr Thr Asp Gin Ser Thr Phe Asp 

180 185 190 



ATT TTG CAG GAT TTG GAG 
He Leu Gin Asp Leu Glu 
195 

AAT GAG AGT CCT TGG AGA 
Asn Glu Ser Pro Tro Arg 
210 

CTT TCT CCT CTG GCG GGA 
Leu Ser Pro Leu Ala Gly 
225 230 

TCG AAT GAG GAC TGC AAG 
Ser Asn Glu Asp Cys Lys 

245 

ATT AAG GAT AAT GGA GAT 
He Lys Asp Asn Gly Asp 

260 

CTG CCC CAA GTG AAA ACA 
Leu Pro Gin Val Lys Thr 
275 

CCT GGG GTA ATT AAG CAA 
Pro Gly Val He Lys Gin 
290 



TTT TCT TCT GGG TCC CCA 
Phe Ser Ser Gly Ser Pro 
200 

TCA GAC CTG TTG ATA GAT 
Ser Asp Leu Leu He Asp 
215 220 

GAA GAC GAT TCA TTC CTT 
Glu Asp Asp Ser Phe Leu 

235 

CCT CTC ATT TTA CCG GAC 
Pro Leu He Leu Pro Asp 

250 

CTG GTT TTG TCA AGC CCC 
Leu Val Leu Ser Ser Pro 
265 

GAA AAA GAA GAT TTC ATC 
Glu Lys Glu Asp Phe He 
280 

GAG AAA CTG GGC ACA GTT 
Glu Lys Leu Gly Thr Val 
295 300 



GGT AAA GAG ACG 624 

Gly Lys Glu Thr 

205 

GAA AAC TGT TTG 67 2 

Glu Asn Cys Leu 



TTG GAA GGA AAC 7 20 

Leu Glu Gly Asn 

240 

ACT AAA CCC AAA 7 68 

Thr Lys Pro Lys 
255 

AGT AAT GTA ACA 816 
Ser Asn Val Thr 
270 

GAA CTC TGC ACC 8 64 

Glu Leu Cys Thr 

285 

TAC TGT CAG GCA 912 
Tyr Cys Gin Ala 



AGC TTT CCT GGA GCA AAT ATA ATT GGT AAT AAA ATG TCT GCC ATT TCT 
Ser Phe Pro Gly Ala Asn He He Gly Asn Lys Met Ser Ala He Ser 
305 310 ' 315 320 



960 
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GTT CAT GGT GTG AGT ACC TCT GGA GGA CAG ATG TAC CAC TAT GAC ATG 1008 
Val His Gly Val Ser Thr Ser Gly Gly Gin Met Tyr His Tyr Asd Met 

325 330 335 

AAT AC A GCA TCC CTT TCT CAA CAG CAG GAT CAG AAG CCT ATT TTT AAT 1056 
Asn Thr Ala Ser Leu Ser Gin Gin Gin Asp Gin Lys Pro He Phe Asn 

340 345 350 

GTC ATT CCA CCA ATT CCC GTT GGT TCC GAA AAT TGG AAT AGG TGC CAA 1104 
Val He Pro Pro He Pro Val Gly Ser Glu Asn Trp Asn Arg Cys Gin 
355 360 365 

GGA TCT GGA GAT GAC AAC TTG ACT TCT CTG GGG ACT CTG AAC TTC CCT 1152 
Gly Ser Gly Asp Asp Asn Leu Thr Ser Leu Gly Thr Leu Asn Phe Pro 
370 375 380 

GGT CGA ACA GTT TTT TCT AAT GGC TAT TCA AGC CCC AGC ATG AGA CCA 1200 
Gly Arg Thr Val Phe Ser Asn Gly Tyr Ser Ser Pro Ser Met Arg Pro 
385 390 395 400 

GAT GTA AGC TCT CCT CCA TCC AGC TCC TCA ACA GCA ACA ACA GGA CCA 124 8 

Asp Val Ser Ser Pro Pro Ser Ser Ser Ser Thr Ala Thr Thr Gly Pro 

405 410 415 

CCT CCC AAA CTC TGC CTG GTG TGC TCT GAT GAA GCT TCA GGA TGT CAT 1296 
Pro Pro Lys Leu Cys Leu Val Cys Ser Asp Glu Ala Ser Gly Cys His 

420 425 430 

TAT GGA GTC TTA ACT TGT GGA AGC TGT AAA GTT TTC TTC AAA AGA GCA 134 4 

Tyr Gly Val Leu Thr Cys Gly Ser Cys Lys Val Phe Phe Lys Arg Ala 
435 440 445 

GTG GAA GGA CAG CAC AAT TAC CTA TGT GCT GGA AGG AAT GAT TGC ATC 1392 
Val Glu Gly Gin His Asn Tyr Leu Cys Ala Gly Arg Asn Asp Cys He 
450 455 460 

ATC GAT AAA ATT CGA AGA AAA AAC TGC CCA GCA TGC CGC TAT CGA AAA 1440 
He Asp Lys He Arg Arg Lys Asn Cys Pro Ala Cys Arg Tyr Arg Lys 
465 470 475 480 

TGT CTT CAG GCT GGA ATG AAC CTG GAA GCT CGA AAA ACA AAG AAA AAA 14 38 

Cys Leu Gin Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys Lys Lys 

485 490 495 

ATA AAA GGA ATT CAG CAG GCC ACT ACA GGA GTC TCA CAA GAA ACC TCT 1536 
He Lys Gly He Gin Gin Ala Thr Thr Gly Val Ser Gin Glu Thr Ser 

500 505 510 

GAA AAT CCT GGT AAC AAA ACA ATA GTT CCT GCA ACG TTA CCA CAA CTC 158 4 

Glu Asn Pro Gly Asn Lys Thr He Val Pro Ala Thr Leu Pro Gin Leu 
515 520 525 

ACC CCT ACC CTG GTG TCA CTG TTG GAG GTT ATT GAA CCT GAA GTG TTA 1632 
Thr Pro Thr Leu Val Ser Leu Leu Glu Val lie Glu Pro Glu Val Leu 
530 535 540 

TAT GCA GGA TAT GAT AGC TCT GTT CCA GAC TCA ACT TGG AGG ATC ATG 1630 
Tyr Ala Gly Tyr Asp Ser Ser Val Pro Asp Ser Thr Trp Arg He Met 
545 550 555 560 

ACT ACG CTC AAC ATG TTA GGA GGG CGG CAA GTG ATT GCA GCA GTG AAA 1728 
Thr Thr Leu Asn Met Leu Gly Gly Arg Gin Val lie Ala Ala Val Lys 

565 570 575 

TGG GCA AAG GCA ATA CCA GGT TTC AGG AAC TTA CAC CTG GAT GAC CAA 17 7 6 

Trp Ala Lys Ala He Pro Gly Phe Arg Asn Leu His Leu Asp Asp Gin 

580 585 590 
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ATG ACC CTA CTG CAG TAC TCC TGG ATG TTT CTT ATG GCA TTT GCT CTG 1824 
Met Thr Leu Leu Gin Tyr Ser Trp Met Phe Leu Met Ala Phe Ala Leu 
595 600 605 

GGG TGG AGA TCA TAT AGA CAA TCA AGT GCA AAC CTG CTG TGT TTT GCT 1872 
Gly Trp Arg Ser Tyr Arg Gin Ser Ser Ala Asn Leu Leu Cys Phe Ala 
610 615 620 

CCT GAT CTG ATT ATT AAT GAG CAG AGA ATG ACT CTA CCC TGC ATG TAC 1920 
Pro Asp Leu lie lie Asn Glu Gin Arg Met Thr Leu Pro Cys Met Tyr 
625 630 635 640 

GAC CAA TGT AAA CAC ATG CTG TAT GTT TCC TCT GAG TTA CAC AGG CTT 19 68 

Asp Gin Cys Lys His Met Leu Tyr Val Ser Ser Glu Leu His Arg Leu 

645 650 655 

CAG GTA TCT TAT GAA GAG TAT CTC TGT ATG AAA ACC TTA CTG CTT CTC 2016 
Gin Val Ser Tyr Glu Glu Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu 

660 665 670 

TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC CAA GAG CTA TTT GAT GAA 2064 
Ser Ser Val Pro Lys Asp Gly Leu Lys Ser Gin Glu Leu Phe Asp Glu 
675 680 685 

ATT AGA ATG ACC TAC ATC AAA GAG CTA GGA AAA GCC ATT GTC AAG AGG 2112 
He Arg Met Thr Tyr He Lys Glu Leu Gly Lys Ala He Val Lys Arg 
690 695 700 

GAA GGA AAC TCC AGC CAG AAC TGG CAG CGG TTT TAT CAA CTG ACA AAA 2160 
Glu Gly Asn Ser Ser Gin Asn Trp Gin Arg Phe Tyr Gin Leu Thr Lys 
705 710 715 720 

CTC TTG GAT TCT ATG CAT GAA GTG GTT GAA AAT CTC CTT AAC TAT TGC 2208 
Leu Leu Asp Ser Met His Glu Val Val Glu Asn Leu Leu Asn Tyr Cys 

725 730 735 

TTC CAA ACA TTT TTG GAT AAG ACC ATG TCC ACC GAG TTC CCC GAG ATG 225 6 

Phe Gin Thr Phe Leu Asp Lys Thr Met Ser Thr Glu Phe Pro Glu Met 

740 * ' 745 750 

TTA GCT GAA ATC ATC ACC AAT CAG ATA CCA AAA TAT TCA AAT GGA AAT 2304 
Leu Ala Glu He He Thr Asn Gin He Pro Lys Tyr Ser Asn Gly Asn 
755 760 765 

ATC AAA AAA CTT CTG TTT CAT CAA AAG TGA 2 334 

He Lys Lys Leu Leu Phe His Gin Lys 
770 775 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2004 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CRE-LBD (GR ( 174 7 /T ) 



{ B ) EMPLACEMENT : 1 . .2001 



(Proteine de fusion du domaine 
LBD du recepteur humain des 
glucocort icoides mute en 
position 747 et de la proteine 
recombinase Cre) 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 667 acicies amines 

(3) TYPE: acide amine 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATG TCC AAT TTA CTG ACC GTA CAC CAA AAT TTG CCT GCA TTA CCG GTC 4 8 

Met Ser Asn Leu Leu Thr Val His Gin Asn Leu Pro Ala Leu Pro Val 
15 10 15 

GAT GCA ACG AGT GAT GAG GTT CGC AAG AAC CTG ATG GAC ATG TTC AGG 96 
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asd Met Phe Arg 

20 25 30 

GAT CGC CAG GCG TTT TCT GAG CAT ACC TGG AAA ATG CTT CTG TCC GTT 14 4 

Asp Arg Gin Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val 

35 40 45 

TGC CGG TCG TGG GCG GCA TGG TGC AAG TTG AAT AAC CGG AAA TGG TTT 192 
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe 
50 55 60 

CCC GCA GAA CCT GAA GAT GTT CGC GAT TAT CTT CTA TAT CTT CAG GCG 24 0 

Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gin Ala 
65 70 75 80 

CGC GGT CTG GCA GTA AAA ACT ATC CAG CAA CAT TTG GGC CAG CTA AAC 288 
Arg Gly Leu Ala Val Lys Thr He Gin Gin His Leu Gly Gin Leu Asn 

85 90 95 

ATG CTT CAT CGT CGG TCC GGG CTG CCA CGA CCA AGT GAC AGC AAT GCT 336 
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala 

100 105 110 

GTT TCA CTG GTT ATG CGG CGG ATC CGA AAA GAA AAC GTT GAT GCC GGT 38 4 

Val Ser Leu Val Met Arg Arg He Arg Lys Glu Asn Val Asp Ala Gly 
115 120 125 

GAA CGT GCA AAA CAG GCT CTA GCG TTC GAA CGC ACT GAT TTC GAC CAG 4 32 

Glu Arg Ala Lys Gin Ala Leu Ala Phe Glu Arg Thr Asd Phe Asp Gin 
130 135 140 

GTT CGT TCA CTC ATG GAA AAT AGC GAT CGC TGC CAG GAT ATA CGT AAT 4 80 

Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gin Asp He Arg Asn 
1^5 150 155 160 

CTG GCA TTT CTG GGG ATT GCT TAT AAC ACC CTG TTA CGT ATA GCC GAA 52 8 

Leu Ala Phe Leu Gly He Ala Tyr Asn Thr Leu Leu Arg He Ala Glu 

165 170 175 

ATT GCC AGG ATC AGG GTT AAA GAT ATC TCA CGT ACT GAC GGT GGG AGA 57 6 

He Ala Arg He Arg Val Lys Asp He Ser Arg Thr Asp Gly Gly Arg 

180 185 190 

ATG TTA ATC CAT ATT GGC AGA ACG AAA ACG CTG GTT AGC ACC GCA GGT 624 
Met Leu He His lie Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly 
195 200 205 

GTA GAG AAG GCA CTT AGC CTG GGG GTA ACT AAA CTG GTC GAG CGA TGG 672 
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Tro 
210 215 - 220 
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ATT TCC GTC TCT GGT GTA GCT GAT GAT CCG AAT AAC TAC CTG TTT TGC 720 

lie Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys 

225 230 235 240 

CGG GTC AGA AAA AAT GGT GTT GCC GCG CCA TCT GCC ACC AGC CAG CTA 7 68 

Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gin Leu 

245 250 255 

TCA ACT CGC GCC CTG GAA GGG ATT TTT GAA GCA ACT CAT CGA TTG ATT 8 1 6 

Ser Thr Arg Ala Leu Glu Gly He Phe Glu Ala Thr His Arg Leu He 

260 265 270 



TAC GGC GCT AAG GAT GAC TCT GGT CAG AGA TAC CTG GCC TGG TCT GGA 
Tyr Gly Ala Lys Asp Asp Ser Gly Gin Arg Tyr Leu Ala Trp Ser Gly 
275 280 285 



864 



CAC AGT GCC CGT GTC GGA GCC GCG CGA GAT ATG GCC CGC GCT GGA GTT 912 
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val 
290 295 300 

TCA ATA CCG GAG ATC ATG CAA GCT GGT GGC TGG ACC AAT GTA AAT ATT 960 
Ser He Pro Glu He Met Gin Ala Gly Gly Trp Thr Asn Val Asn He 
305 310 315 320 

GTC ATG AAC TAT ATC CGT AAC CTG GAT AGT GAA ACA GGG GCA ATG GTG 1003 
Val Met Asn Tyr He Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val 

325 330 335 

CGC CTG CTG GAA GAT GGC GAT CTC GAG ATT CAG CAG GCC ACT ACA GGA 1056 
Arg Leu Leu Glu Asp Gly Asp Leu Glu He Gin Gin Ala Thr Thr Gly 

340 345 350 

GTC TCA CAA GAA ACC TCT GAA AAT CCT GGT AAC AAA ACA ATA GTT CCT 1104 
Val Ser Gin Glu Thr Ser Glu Asn Pro Gly Asn Lys Thr He Val Pro 
355 360 365 

GCA ACG TTA CCA CAA CTC ACC CCT ACC CTG GTG TCA CTG TTG GAG GTT 1152 
Ala Thr Leu Pro Gin Leu Thr Pro Thr Leu Val Ser Leu Leu Glu Val 
370 375 380 

ATT GAA CCT GAA GTG TTA TAT GCA GGA TAT GAT AGC TCT GTT CCA GAC 1200 
He Glu Pro Glu Val Leu Tyr Ala Gly Tyr Asp Ser Ser Val Pro Asp 
385 390 395 400 

TCA ACT TGG AGG ATC ATG ACT ACG CTC AAC ATG TTA GGA GGG CGG CAA 124 3 

Ser Thr Trp Arg lie Met Thr Thr Leu Asn Met Leu Gly Gly Arg Gin 

405 410 415 

GTG ATT GCA GCA GTG AAA TGG GCA AAG GCA ATA CCA GGT TTC AGG AAC 12 96 

Val He Ala Ala Val Lys Trp Ala Lys Ala He Pro Gly Phe Arg Asn 

420 425 430 

TTA CAC CTG GAT GAC CAA ATG ACC CTA CTG CAG TAC TCC TGG ATG TTT 134 4 

Leu His Leu Asp Asp Gin Met Thr Leu Leu Gin Tyr Ser Trp Met Phe 
435 440 445 

CTT ATG GCA TTT GCT CTG GGG TGG AGA TCA TAT AGA CAA TCA AGT GCA 1392 
Leu Met Ala Phe Ala Leu Gly Trp Arg Ser Tyr Arg Gin Ser Ser Ala 
450 455 460 

AAC CTG CTG TGT TTT GCT CCT GAT CTG ATT ATT AAT GAG CAG AGA ATG 14 40 

Asn Leu Leu Cys Phe Ala Pro Asp Leu He He Asn Glu Gin Arg Met 
465 470 475 " 480 



ACT CTA CCC TGC ATG TAC GAC CAA TGT AAA CAC ATG CTG TAT GTT TCC 
Thr Leu Pro Cys Met Tvr Asp Gin Cys Lys His Met Leu Tyr Val Ser 

485 490 * 495 



1488 
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TCT GAG TTA CAC AGG CTT CAG GTA TCT TAT GAA GAG TAT CTC TGT ATG 1536 
Ser Glu Leu His Arg Leu Gin Val Ser Tyr Glu Glu Tyr Leu Cys Met 

500 505 " 510 

AAA ACC TTA CTG CTT CTC TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC 1584 
Lys Thr Leu Leu Leu Leu Ser Ser Val Pro Lys Asp Gly Leu Lys Ser 
515 520 525 

CAA GAG CTA TTT GAT GAA ATT AGA ATG ACC TAC ATC AAA GAG CTA GGA 1632 
Gin Glu Leu Phe Asp Glu He Arg Met Thr Tyr He Lys Glu Leu Gly 
530 535 540 

AAA GCC ATT GTC AAG AGG GAA GGA AAC TCC AGC CAG AAC TGG CAG CGG 1680 
Lys Ala He Val Lys Arg Glu Gly Asn Ser Ser Gin Asn Trp Gin Arq 
5*5 550 555 560 

TTT TAT CAA CTG ACA AAA CTC TTG GAT TCT ATG CAT GAA GTG GTT GAA 1728 
Phe Tyr Gin Leu Thr Lys Leu Leu Asp Ser Met His Glu Val Val Glu 

565 570 575 

AAT CTC CTT AAC TAT TGC TTC CAA ACA TTT TTG GAT AAG ACC ATG TCC 17 76 

Asn Leu Leu Asn Tyr Cys Phe Gin Thr Phe Leu Asp Lys Thr Met Ser 

580 585 590 

ACC GAG TTC CCC GAG ATG TTA GCT GAA ATC ATC ACC AAT CAG ATA CCA 1824 
Thr Glu Phe Pro Glu Met Leu Ala Glu He He Thr Asn Gin He Pro 
595 600 605 

AAA TAT TCA AAT GGA AAT ATC AAA AAA CTT CTG TTT CAT CAA AAG GGT 187 2 

Lys Tyr Ser Asn Gly Asn He Lys Lys Leu Leu Phe His Gin Lys Gly 
610 615 620 

ACC AGC CGT GGA GGG GCA TCC GTG GAG GAG ACG GAC CAA AGC CAC TTG 1920 
Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gin Ser His Leu 
625 630 635 640 

GCC ACT GCG GGC TCT ACT TCA TCG CAT TCC TTG CAA AAG TAT TAC ATC 1968 
Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gin Lys Tyr Tyr He 

645 650 655 

ACG GGG GAG GCA GAG GGT TTC CCT GCC ACA GTC TGA 2004 
Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Val 

660 665 



(2) INFORMATIONS POUR LA SEQ ID NO: 3 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 6094 paires de bases 

(B) TYPE: nucleotide 

(C> NOMBRE DE BRINS: simple 
(D) CONFIGURATION: circulaire 



(ii) TYPE DE MOLECULE: ADNc 

( ix ) CARACTERISTIQUE : 

(A) NOK/CLE:pCRE-LBD[GR(I747/T] (Plasmide d'expression de la 

prot6ine de fusion 
Cre-LBD[GR(I747/T) ] 



(B) EMPLACEMENT : 1 . .6091 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3 



GTCGACTTCT GAGGCGGAAA GAACCAGCTG TGGAATGTGT GTCAGTTAGG GTGTGGAAAG 60 



TCCCCAGGCT CCCCAGCAGG CAGAAGTATG CAAAGCATGC ATCTCAATTA GTCAGCAACC 120 
AGGTGTGGAA AGTCCCCAGG CTCCCCAGCA GGCAGAAGTA TGCAAAGCAT GCATCTCAAT 180 



TAGTCAGCAA CCATAGTCCC GCCCCTAACT CCGCCCATCC CGCCCCTAAC TCCGCCCAGT 24 0 



TCCGCCCATT CTCCGCCCCA TGGCTGACTA ATTTTTTTTA TTTATGCAGA GGCCGAGGCC 300 



GCCTCGGCCT CTGAGCTATT CCAGAAGTAG TGAGGAGGCT TTTTTGGAGG CCTAGGCTTT 360 



TGCAAAAAGC TGGATCGATC CTGAGAACTT CAGGGTGAGT TTGGGGACCC TTGATTGTTC 4 20 



TTTCTTTTTC GCTATTGTAA AATTCATGTT ATATGGAGGG GGCAAAGTTT TCAGGGTGTT 4 80 



GTTTAGAATG GGAAGATGTC CCTTGTATCA CCATGGACCC TCATGATAAT TTTGTTTCTT 54 0 



TCACTTTCTA CTCTGTTGAC AACCATTGTC TCCTCTTATT TTCTTTTCAT TTTCTGTAAC 600 



TTTTTCGTTA AACTTTAGCT TGCATTTGTA ACGAATTTTT AAATTCACTT TTGTTTATTT 660 



GTCAGATTGT AAGTACTTTC TCTAATCACT TTTTTTTCAA GGCAATCAGG GTATATTATA 720 



TTGTACTTCA GCACAGTTTT AGAGAACAAT TGTTATAATT AAATGATAAG GTAGAATATT 7 80 



TCTGCATATA AATTCTGGCT GGCGTGGAAA TATTCTTATT GGTAGAAACA ACTACATCCT 84 0 



GGTCATCATC CTGCCTTTCT CTTTATGGTT ACAATGATAT ACACTGTTTG AGATGAGGAT 900 



AAAATACTCT GAGTCCAAAC CGGGCCCCTC TGCTAACCAT GTTCATGCCT TCTTCTTTTT 960 



CCTACAGCTC CTGGGCAACG TGCTGGTTAT TGTGCTGTCT CATCATTTTG GCAAAGAATT 1020 



GTAATACGAC TCACTATAGG GCGAATTCCA CCATGTCCAA TTTACTGACC GTACACCAAA 1080 
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ATTTGCCTGC ATTACCGGTC GATGCAACGA GTGATGAGGT TCGCAAGAAC CTGATGGACA 1140 
TGTTCAGGGA TCGCCAGGCG TTTTCTGAGC ATACCTGGAA AATGCTTCTG TCCGTTTGCC 1200 
GGTCGTGGGC GGCATGGTGC AAGTTGAATA ACCGGAAATG GTTTCCCGCA GAACCTGAAG 1260 
ATGTTCGCGA TTATCTTCTA TATCTTCAGG CGCGCGGTCT GGCAGTAAAA ACTATCCAGC 1320 
AACATTTGGG CCAGCTAAAC ATGC7TCATC GTCGGTCCGG GCTGCCACGA CCAAGTGACA 1380 
GCAATGCTGT TTCACTGGTT ATGCGGCGGA TCCGAAAAGA AAACGTTGAT GCCGGTGAAC 14 4 0 
GTGCAAAACA GGCTCTAGCG TTCGAACGCA CTGATTTCGA CCAGGTTCGT TCACTCATGG 1500 

AAAATAGCGA TCGCTGCCAG GATATACGTA ATCTGGCATT TCTGGGGATT GCTTATAACA 1560 

CCCTGTTACG TATAGCCGAA ATTGCCAGGA TCAGGGTTAA AGATATCTCA CGTACTGACG 1620 

GTGGGAGAAT GTTAATCCAT ATTGGCAGAA CGAAAACGCT GGTTAGCACC GCAGGTGTAG 1680 

AGAAGGCACT TAGCCTGGGG GTAACTAAAC TGGTCGAGCG ATGGATTTCC GTCTCTGGTG 17 4 0 

TAGCTGATGA TCCGAATAAC TACCTGTTTT GCCGGGTCAG AAAAAATGGT GTTGCCGCGC 1800 

CATCTGCCAC CAGCCAGCTA TCAACTCGCG CCCTGGAAGG GATTTTTGAA GCAACTCATC 18 60 

GATTGATTTA CGGCGCTAAG GATGACTCTG GTCAGAGATA CCTGGCCTGG TCTGGACACA 1920 

GTGCCCGTGT CGGAGCCGCG CGAGATATGG CCCGCGCTGG AGTTTCAATA CCGGAGATCA 1980 

TGCAAGCTGG TGGCTGGACC AATGTAAATA TTGTCATGAA CTATATCCGT AACCTGGATA 204 0 

GTGAAACAGG GGCAATGGTG CGCCTGCTGG AAGATGGCGA TCTCGAGATT CAGCAGGCCA 2100 

CTACAGGAGT CTCACAAGAA ACCTCTGAAA ATCCTGGTAA CAAAACAA7A GTTCCTGCA^ 2160 

CGTTACCACA ACTCACCCCT ACCCTGGTGT CACTGTTGGA GGTTATTGAA CCTGAAGTGT 2220 

TATATGCAGG ATATGATAGC TCTGTTCCAG ACTCAACTTG GAGGATCATG ACTACGCTCA 2230 
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ACATGTTAGG AGGGCGGCAA GTGATTGCAG CAGTGAAATG GGCAAAGGCA ATACCAGGTT 2 34 0 



TCAGGAACTT ACACCTGGAT GACCAAATGA CCCTACTGCA GTACTCCTGG ATGTTTCTTA 2 4 00 



TGGCATTTGC TCTGGGGTGG AGATCATATA GACAATCAAG TGCAAACCTG CTGTGTTTTG 2 4 60 



CTCCTGATCT GATTATTAAT GAGCAGAGAA TGACTCTACC CTGCATGTAC GACCAATGTA 2520 



AACACATGCT GTATGTTTCC TCTGAGTTAC ACAGGCTTCA GGTATCTTAT GAAGAGTATC 2580 



TCTGTATGAA AACCTTACTG CTTCTCTCTT CAGTTCCTAA GGACGGTCTG AAGAGCCAAG 264 0 



AGCTATTTGA TGAAATTAGA ATGACCTACA TCAAAGAGCT AGGAAAAGCC ATTGTCAAGA 2700 



GGGAAGGAAA CTCCAGCCAG AACTGGCAGC GGTTTTATCA ACTGACAAAA CTCTTGGATT 27 60 



CTATGCATGA AGTGGTTGAA AATCTCCTTA ACTATTGCTT CCAAACATTT TTGGATAAGA 28 20 



CCATGTCCAC CGAGTTCCCC GAGATGTTAG CTGAAATCAT CACCAATCAG ATACCAAAAT 2880 



ATTCAAATGG AAATATCAAA AAACTTCTGT TTCATCAAAA GGGTACCAGC CGTGGAGGGG 294 0 



CATCCGTGGA GGAGACGGAC CAAAGCCACT TGGCCACTGC GGGCTCTACT TCATCGCATT 3000 



CCTTGCAAAA GTATTACATC ACGGGGGAGG CAGAGGGTTT CCCTGCCACA GTCTGAGAGC 3060 



TCCCTGGAAT TCGGATCTTA TTAAAGCAGA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 3120 



AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT 3180 



GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG GTCGACTCTA GACTCTTCCG 324 0 



CTTCCTCGCT CACTGACTCG CTGCGCTCGG TCGTTCGGCT GCGGCGAGCG GTATCAGCTC 3300 



ACTCAAAGGC GGTAATACGG TTATCCACAG AATCAGGGGA TAACGCAGGA AAGAACATGT 3360 



GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC CGCGTTGCTG GCGTTTTTCC 34 20 



ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG CTCAAGTCAG AGGTGGCGAA 34 80 
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ACCCGACAGG ACTATAAAGA TACCAGGCGT TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC 354 0 
CTGTTCCGAC CCTGCCGCTT ACCGGATACC TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG 3600 
CGCTTTCTCA TAGCTCACGC TGTAGGTATC TCAGTTCGGT GTAGGTCGTT CGCTCCAAGC 3660 
TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG CGCCTTATCC GGTAACTATC 3720 
GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT GGCAGCAGCC ACTGGTAACA 3780 
GGATTAGCAG AGCGAGGTAT GTAGGCGGTG CTACAGAGTT CTTGAAGTGG TGGCCTAACT 384 0 
ACGGCTACAC TAGAAGGACA GTATTTGGTA TCTGCGCTCT GCTGAAGCCA GTTACCTTCG 3900 
GAAAAAGAGT TGGTAGCTCT TGATCCGGCA AACAAACCAC CGCTGGTAGC GGTGGTTTTT 3960 
TTGTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC TCAAGAAGAT CCTTTGATCT 4 020 
TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAACTCACG TTAAGGGATT TTGGTCATGA 4 080 
GATTATCAAA AAGGATCTTC ACCTAGATCC TTTTAAATTA AAAATGAAGT TTTAAATCAA 4140 

TCTAAAGTAT ATATGAGTAA ACTTGGTCTG ACAGTTACCA ATGCTTAATC AGTGAGGCAC 4 200 

CTATCTCAGC GATCTGTCTA TTTCGTTCAT CCATAGTTGC CTGACTCCCC GTCGTGTAGA 4 260 

TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC TGCAATGATA CCGCGAGACC 4 320 

CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC AGCCGGAAGG GCCGAGCGCA 4 380 

GAAGTGGTCC TGCAACTTTA TCCGCCTCCA TCCAGTCTAT TAATTGTTGC CGGGAAGCTA 4 4 40 

GAGTAAGTAG TTCGCCAGTT AATAGTTTGC GCAACGTTGT TGCCATTGCT ACAGGCATCG 4 500 



TGGTGTCACG CTCGTCGTTT GGTATGGCTT CATTCAGCTC CGGTTCCCAA CGATCAAGGC 
GAGTTACATG ATCCCCCATG TTGTGCAAAA AAGCGGTTAG CTCCTTCGGT CCTCCGATCG 
TTGTCAGA&.G TAAGT7GGCC GCAGTGTTAT CACTCATGGT TATGGCAGCA CTGCATAATT 



4560 



4620 



4 680 
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CTCTTACTGT CATGCCATCC GTAAGATGCT TTTCTGTGAC TGGTGAGTAC TCAACCAAGT 47 4 0 



CATTCTGAGA ATAGTGTATG CGGCGACCGA GTTGCTCTTG CCCGGCGTCA ATACGGGATA 4 800 



ATACCGCGCC ACATAGCAGA ACTTTAAAAG TGCTCATCAT TGGAAAACGT TCTTCGGGGC 4 8 60 



GAAAACTCTC AAGGATCTTA CCGCTGTTGA GATCCAGTTC GATGTAACCC ACTCGTGCAC 4 920 



CCAACTGATC TTCAGCATCT TTTACTTTCA CCAGCGTTTC TGGGTGAGCA AAAACAGGAA 4 980 



GGCAAAATGC CGCAAAAAAG GGAATAAGGG CGACACGGAA ATGTTGAATA CTCATACTCT 5040 



TCCTTTTTCA ATATTATTGA AGCATTTATC AGGGTTATTG TCTCATGAGC GGATACATAT 5100 



TTGAATGTAT TTAGAAAAAT AAACAAATAG GGGTTCCGCG CACATTTCCC CGAAAAGTGC 5160 



CACCTGACGT CTAAGAAACC ATTATTATCA TGACATTAAC CTATAAAAAT AGGCGTATCA 5220 



CGAGGCCCCT TTCGTCTCGC GCGTTTCGGT GATGACGGTG AAAACCTCTG AC AC AT GC AG 5280 



CTCCCGGAGA CGGTCACAGC TTGTCTGTAA GCGGATGCCG GGAGCAGACA AGCCCGTCAG 534 0 



GGCGCGTCAG CGGGTGTTGG CGGGTGTCGG GGCTGGCTTA ACTATGCGGC ATCAGAGCAG 54 00 



ATTGTACTGA GAGTGCACCA TATGCGGTGT GAAATACCGC ACAGATGCGT AAGGAGAAAA 54 60 



TACCGCATCA GGAAATTGTA AACGTTAATA TTTTGTTAAA ATTCGCGTTA AATTTTTGTT 5520 



AAATCAGCTC ATTTTTTAAC CAATAGGCCG AAATCGGCAA AATCCCTTAT AAATCAAAAG 5580 



AATAGACCGA GATAGGGTTG AGTGTTGTTC CAGTTTGGAA CAAGAGTCCA CTATTAAAGA 5 64 0 



ACGTGGACTC CAACGTCAAA GGGCGAAAAA CCGTCTATCA GGGCGATGGC CCACTACGTG 5700 



AACCATCACC CTAATCAAGT TTTTTGGGGT CGAGGTGCCG TAAAGCACTA AATCGGAACC 57 60 



CTAAAGGGAG CCCCCGATTT AGAGCTTGAC GGGGAAAGCC GGCGAACGTG GCGAGAAAGG 582 0 



AAGGGAAGAA AGCGAAAGGA GCGGGCGCTA GGGCGCTGGC AAGTGTAGCG GTCACGCTGC 58 80 
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GCGTAACCAC CACACCCGCC GCGCTTAATG CGCCGCTACA GGGCGCGTCG CGCCATTCGC 



5940 



CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC 



6000 



AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC 



6060 



AGTCACGACG TTGTAAAACG ACGGCCAGTG AATT 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: SG52 



6094 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
CTGGAAGATG GCGATCTCGA GATTCAGCAG GCCACT 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 37 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple ' 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: SG53 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CTGTTTCATC AAAAGGGTAC CAGCCGTGGA GGGGCAT 
(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE ■ 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: oligonucleotide synthetique 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
ATTATTATTA CTCGAGTGAT GATG 24 
(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) N OMB RE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
ATCATCATCA TCCGAGTAAT AATA 24 
(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 14 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: SB211 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

GGCAAACACT ATGG 14 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: -PZ105 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
TTGCGTACTG TCCTCTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 
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<i) CARACTERISTIQUES DC LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



( ix ) CARACTERI STI QUE : 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
AAGAAGCCCT TGCAGCCCTC 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
AATTATAACT TCGTATAATG TATGCTATAC GAAGTTATTC 4 0 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
ATCCGAAAAG AAAACGTTGA 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 20 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 
ATCCAGGTTA CGGATATAGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 
GGTTCTCCGG CCGCTTGGGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin£aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 
GAAGGCGATG CGCTGCGAAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce A 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 
CAAGGAGCCT CCTTTCTCTA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE • 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce B 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 
CCTGCTCTAC CTGGTGACTT 



20 
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REVINDICATIONS 

1. Fragment d'ADN codant pour un recepteur nucleaire de 
glucocorticoides modifie, notamment mute dans la region codant pour le 

5 domaine de liaison du ligand, de sorte que 1'activite dudit recepteur est 
inductible plus fortement par un ligand glucocorticoide synthetique que 
par un ligand glucocorticoide naturel. 

2. Fragment d'ADN codant pour le recepteur nucleaire des 
10 glucocorticoides sauvage avec une mutation isoleucine --> threonine 

situee entre les helices HI 1 et H12 de la sequence d'acides amines dudit 
recepteur. 

3. Fragment d'ADN selon la revendication 2, caracterise en ce qu'il a 
15 pour sequence, une sequence codant pour le recepteur nucleaire humain 

des glucocorticoides dont la sequence en acides amines est 
substantiellement telle que representee dans 1'IDS n°l. 

4. Fragment d'ADN selon la revendication 3, caracterise en ce qu'il a 
20 pour sequence la sequence de l'ADNc du recepteur nucleaire humain des 

glucocorticoides substantiellement telle que representee dans 1'IDS n° 1 

5. Fragment d'ADN codant pour un domaine de liaison du ligand 
(LBD) d'un recepteur nucleaire des glucocorticoides comportant une 

25 modification, notamment une mutation de sorte que 1'activite dudit 
domaine de liaison du ligand est inductible plus fortement par liaison a un 
ligand glucocorticoide synthetique que par liaison a un glucocorticoide 

naturel. 

30 6. Fragment d'ADN codant pour le domaine de liaison du ligand 

(LBD) du recepteur nucleaire humain des glucocorticoides naturel avec 
une mutation isoleucine --> threonine en position correspondant a la 
position 747 de la sequence en acides amines dudit recepteur complet. 
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7. Fragment d'ADN codant pour le domaine de liaison du ligand du 
recepteur nucleaire humain des glucocorticoides selon la revendication 6, 
caracterise en ce qu'il a pour sequence, une sequence codant pour les 
acides amines du domaine de liaison du ligand du recepteur nucleaire 
humain des glucocorticoides dont la sequence en acides amines est 
substantiellement telle que representee dans 1'IDS n* 1 de 1'acide amine 
532 a 1'acide amine 777. 

8. Fragment d'ADN selon la revendication 7, caracterise en ce qu'il a 
pour sequence la sequence codant pour le domaine de liaison du ligand 
(LBD) du recepteur nucleaire humain des glucocorticoides 
substantiellement telle que representee dans 1'IDS n° 1 du codon 532 au 
codon 777. 

9. Recepteur nucleaire des glucocorticoides modifie, notamment 
mute dans la region du domaine de liaison du ligand, de sorte que Tactivite 
dudit recepteur est inductible plus fortement par un ligand 
glucocorticoide synthetique que par un ligand glucocorticoide naturel. 

10. Recepteur selon la revendication 9, caracterise en ce qu'il a 
pour sequence, la sequence en acides amines du recepteur nucleaire 
humain des glucocorticoides sauvage avec une mutation isoleucine --> 
threonine situee entre les helices Ml et H12. 

11. Recepteur nucleaire humain des glucocorticoides selon la 
revendication 10, caracterise en ce qu'il a pour sequence en acides 

amines, une sequence substantiellement telle que representee dans 1'IDS 
n°l. 

12. Domaine de liaison du ligand du recepteur nucleaire des 
glucocorticoides selon I'une des revcndications 9 a 11. 
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13. Domaine de liaison du ligand du recepteur nucleaire humain des 
glucocorticoides USD [GR(1747/T)] ( caracterise en ce qu'il a pour sequence, 
la sequence en acides amines du domaine de liaison du ligand du recepteur 
des glucocorticoides humain substantiellement telle que representee dans 
1'IDS n" 1 de l'acide amine 532 a l'acide amine 777. 

14. Systeme vectoriel d'expression conditionnelle d'une proteine 
notamment une proteine etrangere dans des cellules notes comporrant un 
element de controle de la transcription inductible par un complexe forme 
par un recepteur nucleaire des glucocorticoides et un ligand, caracterise 

en ce qu'il comprend : 

- un premier fragment d'ADN consistant en un fragment d'ADN 
codant pour ladite proteine sous le controle d'elements assurant son 
expression dans lesdites cellules notes, iesdits elements assurant son 
expression comprenant une sequence de controle de transcription 
(RE) inductible par le recepteur selon l'une des revindications 9 a 
11, complexe a un ligand glucocortico'ide synthetique, et 

- un deuxieme fragment d'ADN consistant en un fragment d'ADN 
fonctionnel codant pour ledit recepteur selon l'une des 
revendications 1 a 4 ou seulement une partie dudit fragment 
comprenant la region qui reconnait le ligand (LBD) selon l'une des 
revendications 5 a 8, et la region de liaison a l'ADN (DBD) qui se fixe 
sur ladite sequence de controle de la transcription (RE), 

- Iesdits premier et deuxieme fragments d'ADN pouvant etre portcs 
par un meme vecteur ou deux vecteurs separement. 

15. Systeme vectoriel selon la revendication 14, caracterise en ce 

qu'il comporte l'ADNc codant pour : 

- la region LBD, representee par des codons codant les acides amines 
n° 532 a 777 dans 1'IDS n° 1, et 

- la region DBD, representee par des codons codant les acides amines 
n° 421 a 487 dans 1'IDS n' 1. 
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16. Systeme vectoriel selon la revendication 14, caracterise en ce 
qu'on remplace la sequence codant pour le domaine de liaison a 1'ADN 
(DBD) du recepteur des glucocorticoids par celle d'un autre 
transactivateur, notamment celui de la proteine de levure Gal 4 et on 
remplace la sequence de controle de transcription (RE) du recepteur des 
glucocorticoides par celle reconnue par ledit autre transactivateur, 
notamment la sequence 17m reconnue par le transactivateur Gal 4. 

17. Procede d'expression d'une proteine etrangere dans des cellules 
humaines ou animales notamment de mammiferes, caracterise en ce que 
Ton cultive des cellules qui contiennent un systeme vectoriel selon I'une 
des revendications 14 a 16, et en ce qu'on ajoute ledit ligand synthetique, 
dans le milieu de culture, puis on recupere la proteine synthetisee. 

18. Procede selon la revendication 17, caracterise en ce que ledit 
ligand synthetique est choisi parmi la dexamethasone, le triamcinolone 
acetonide, le RU2836, le bimetrazole, le deacylcortivazol et le fluocinolone 
acetonide. 



19. Gene de fusion comprenant un fragment d'ADN selon I'une des 
revendications 1 a 8 et un fragment d'ADN codant pour une proteine dont 
on veut reguler 1'activite, ladite activite etant inductible plus fortement 
par liaison dudit recepteur ou dudit domaine de liaison du ligand du 
recepteur avec undit ligand glucocorticoide synthetique qu'avec un 
ligand glucocorticoide naturel, lorsque ladite proteine se trouvc fusionnee 
audit recepteur ou audit domaine de liaison du ligand dudit recepteur. 

20. Gene de fusion selon la revendication 19, caracterise en ce que 
ladite proteine est une proteine recombinase. 

21. Gene de fusion selon la revendication 20, caracterise en ce que 
ladite proteine est une recombinase de la famille des integrases A. 

22. Gene de fusion selon la revendication 21, caracterise en ce que la 
proteine recombinase est la recombinase Cre du bacteriophage P,. 
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23. Gene de fusion selon la revendication 22, comprenant un 
fragment d'ADN codant pour la proteine recombinase Cre du 
bacteriophage P lf et le fragment d'ADN codant pour le domaine de liaison 
du ligand du recepteur nucleaire humain des glucocorticoides modifie 
selon Tune des revendications 5 ou 8. 

24. Gene de fusion selon la revendication 23, comprenant dans le 
sens 5' --> 3' : 

- un fragment d'ADN codant pour la recombinase Cre du 
bacteriophage Pi ; 

- un fragment d'ADN codant pour tout ou partie de la region 
charniere D du recepteur nucleaire des glucocorticoides, region 
situee entre le domaine DBD et le domaine LED, et 

- le fragment d'ADN codant pour le domaine de liaison du ligand 
(LBD) modifie, notamment mute, du recepteur nucleaire des 
glucocorticoides selon Tune des revendications 5 ou 8. 

25. Gene de fusion selon la revendication 24, caracterise en ce qu'il 
a pour sequence une sequence codant pour les acides amines de 1'IDS n° 2 
comprenant : 

- les acides amines 1 a 343 qui correspondent a la recombinase Cre ; 

- les acides amines 346 a 377 qui correspondent a la region C- 
terminale de la region D du recepteur humain des glucocorticoides; 

- les acides amines 378 a 623 qui correspondent au LBD [GR(I747/T)]. 

26. Gene dc fusion selon la revendication 25, caracterise en cc qu'il 
a substantiellement la sequence Cre-LBD[GR(I747/T)] telle que representee 
dans TIDS n° 2 dont les acides amines 626 a 667 correspondent a la region F 
du recepteur humain des oestrogenes. 

27. Vecteur d'expression de la proteine de fusion codee par le gene 
de fusion selon l'une des revendications 19 £ 26 dans des cellules hotes 
animales notamment de mammiferes, caracterise en ce qu'il comporte le 
gene de fusion selon Tune des revendications 19 a 26, place sous le 
controle d'elements d'expression assurant son expression dans lesdites 
cellules hotes. 
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28. Proteine de fusion comprenant un recepteur selon Tunc des 
revendications 9 a 11 ou un domaine de liaison du ligand selon Tune des 
revendications 12 ou 13 et une proteine dont l'activite est inductible plus 
fortement par liaison dudit recepteur ou dudit domaine de liaison du ligand 
(LBD) avec undit ligand glucocorticoide synthetique qu'avec un ligand 
glucocorticoide naturel. 

29. Proteine de fusion selon la revendication 28, caracterisee en ce 
que la proteine est une proteine recombinase. 

30. Proteine de fusion selon la revendication 28, caracterisee en ce 
que la proteine est une proteine recombinase de la famille des 
integrases k. 

31. Proteine de fusion selon la revendication 30, caracterisee en ce 
que la recombinase est la proteine Cre du bacteriophage P h 

32. Proteine de fusion selon la revendication 31, comportant en 
outre la partie C- terminale de la region charniere D du recepteur 
nucleaire humain des glucocorticoides, intercalee entre la proteine Cre et 
ledit domaine dc liaison du ligand du recepteur modifie selon l'une des 
revendications 12 ou 13. 

33. Procede de recombinaison, notamment, d'excision, insertion, 
inversion ou translocation conditionnelle au niveau d'un fragment d'ADN 
contenant un ou deux sites de reconnaissance specifique d'une proteine 
recombinase dans des cellules hotes animales, caracterise en ce qu'il 
comporte les etapes dans lesquelles : 

1) on introduit une proteine de fusion selon l'une des 
revendications 29 a 32 ou un vecteur d'expression de ladite proteine 
de fusion selon la revendication 27 dans lesdites cellules hotes dans 
des conditions permettant l'expression d'une proteine dc fusion 
selon l'une des revendications 29 a 32 et, 

2) on complexe ladite proteine de fusion avec ledit ligand 
glucocorticoide synthetique, en mettant ledit ligand en presence 
desdites cellules hotes. 



WO 97/31108 PCT/FR97/00315 

70 

34. Procede de deletion conditionnelle d'un fragment d'ADN dans un 
g6ne dans lequel on met en oeuvre un procede d'excision selon la 
revendication 33, et dans lequel ledit fragment d'ADN a exciser est integre 
entre deux sites de reconnaissance de proteine recombinase orientes en 
repetition directe. 

35. Proced6 selon Tune des revindications 33 ou 34, caracterise en 
ce que lesdits sites de reconnaissance specifique de proteine recombinase 
sont les sites loxP et ladite proteine recombinase est la proteine Cre du 
bacteriophage Pi. 

36. Procede selon Pune des revendications 33 a 35, caracterise en ce 
que ledit fragment d'ADN que Ton veut exciser et lesdits sites de 
reconnaissance specifiques d'une proteine recombinase sont portes par 
un vecteur plasmidique ou viral, ou integres dans un chromosome des 
cellules h6tes. 

37. Proced6 selon Pune des revendications 33 a 36, caracterise en ce 
que Pintegration des sites de reconnaissance specifique de la proteine 
recombinase, notamment du ou des sites loxP, se fait par recombinaison 
homologue du gene comportant ledit fragment d'ADN a inserer ou 
transloquer ou respectivcment a exciser ou inverser avcc undit gene 
modifie comportant ledit fragment d'ADN flanque en 5' et/ou 3' par le ou 
lesdit(s) site(s) de reconnaissance de recombinase, notamment site(s) loxP. 

38. Vecteur de transfert d'un fragment d'ADN dans des cellules hotes 
humaines ou animales, notamment mammiferes, caracterise en ce qu'il 
comporte undit fragment d'ADN a transferer comprenant des sites de 
reconnaissance specifiques de la recombinase, notamment deux sites loxP 
orientes a repetition directe et une cassette depression d'un gene de 
fusion selon Pune des revendications 19 a 26. 
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39. Vecteur selon la revendication 38, caracterise en ce que le gene 
de fusion est place sous le contrdle d'elements d'expression specifiques des 
cellules notes. 

40. Vecteur selon la revendication 39, caracterise en ce qu'il 
comporte la sequence du plasmide pCre-LBD[GR(I747/T)] de I'IDS n° 3. 

41. Procede selon Tune des revendications 33 a 37, caracterise en ce 
que ledit fragment d'ADN a exciser a et£ transfere, notamment integre 
dans le chromosome desdites cellules, a l'aide d'un vecteur de transfer! 
selon la revendication 38. 

42. Vecteur selon la revendication 27 ou 38 pour une utilisation 
comme medicament en therapie genique en combinaison avec un ligand 
glucocorticoide synthetique, notamment la dexamethasone. 

43. Cellule humaine ou animale, notamment de mammiferes 
transfectee par un vecteur d'expression d'une proteine de fusion selon la 
revendication 27. 

44. Cellule humaine ou animale, dans laquelle un fragment d'ADN a 
ete transfere a l'aide d'un vecteur, selon l'une des revendications 38 ou 39. 

45. Cellule animale, notamment de mammiferes exprimant de fagon 
constitutive la proteine dc fusion selon l'une des revendications 28 a 32. 

46. Animal transgenique, notamment souris, comportant un gene 
fonctionnel de la proteine de fusion selon l'une des revendications 28 a 32 
notamment integre dans un de ses chromosomes. 
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47. Animal transgenique selon la revindication 46 dans lequel un 
gene d'interet est modifie par insertion de un ou plusieurs site(s) loxP, 
notamment integre(s) dans un ou plusieurs de ses chromosomes. 

48. Utilisation d'un vecteur, de cellules ou d'un animal selon Tune 
des revendications 45 a 47, comme outil d'analyse ou etude de 
fonctionnement d'un gene donn6 d'une cellule hote. 

49. Methode de traitement des cellules ex vivo ou in vitro impliquant 
la mise en oeuvre d'un procede selon Tune des revendications 33 a 37 ou 41 
et Tutilisation d'un vecteur selon la revendication 42. 



WO 97/31108 



PC17FR97/00315 



1/18 



sites loxP tete beche 



sites loxP en repetition directe 



ADN 




inversion 



A 



t 





Cre 



excision 



i 



t 



integration 





loxP 



S^ATAACTTCGTATAGCATACATTATACGAAGrTAT^' 
3'-TATTGAAGCATATCGTATGTAATATGCTTCAATA-5' 



Sites LoxP situes sur deux chmmn^mpc d iffe 



rents 



b 



3- 



e 




a' n 



b" -j 



chromosome aa' 
et bb' 



Cre 



translocation 



t 




e 



b' -i 



a' -J 



chromosome ab' 
et ba' 



FIG.1 



WO 97/31 108 PCTYFR97/00315 



2/18 



(- -) % ' auosEiuaLuexsp- [he] sp snbijioads uosibh 




c 
o 

CO 

E 

CO 
X 
O 
"O 

0) 

XI 

c 
o 

a 



O 

c 

o 

o 



ID 



WO 97/31108 



3/18 



PCT/FR97/0031S 



O 

m 




ai| uou/ei| 



WO 97/31108 



PCT/FR97/00315 



4/18 



(- -) % 'auoseqjaujBxep-fHE] ap anbtjpads uosiej 




(— ) % 'asBjajionj ajjA^ov 



WO 97/31108 



PCT/FR97/00315 



5/18 



1 



343 



1 



1 



1 



ChER) 



180 263 302 



553 595 













A/B 


C 


D 







DBD 



LBD 



(Cre-ER) 



660 




Cre (1-343) 



ER (282-595) 



(hGR) 



421 488 532 



(I747) 



777 



A/B 



i r 



: :d: 



DBD 



LBD 



i (Cre-LBD[GR(1747/T)]) 



(T747) 667 



Cre (1-343) GR (500-777) 



ER (553-595) 



FIG. 5 



WO 97/31108 



PCTYFR97/00315 



6/18 



Sail 




EcoRI 



/ ^ 

Cre-LBD[GR(I747/T)] 



Xhol 



Sa" EcoRI Kpnl 



representation schematique du plasmide pCre-LBD[GR(l747/T)J 
Les sequences codant pour Cre sont representees par £±j± 



pour les aa 500-777 de hGR(l747/T) par [777; 



pour les aa 553-595 de hER par 




FIG. 6 



WO 97/31108 



PCT/FR97/00315 



7/18 



Sail 

1 GTCGACTTCT GAGGCGGAAA GAACCAGCTG TGGAATGTGT GTCAGTTAGG 
51 GTGTGGAAAG TCCCCAGGCT CCCCAGCAGG CAGAAGTATC CAAAGCATCC 
101 ATCTCAATTA GTCAGCAACC AGGTGTGGAA AGTCCCCAGG CTCCCCAGCA 
151 GGCAGAAGTA TGCAAAGCAT GCATCTCAAT TAGTCAGCAA CCATAGTCCC 
201 GCCCCTAACT CCGCCCATCC CGCCCCTAAC TCCGCCCAGT TCCGCCCATT 
251 CTCCGCCCCA TGGCTGACTA ATTTTTTTTA TTTATCCAGA GCCCGAGGCC 
301 GCCTCGGCCT CTGAGCTATT CCAGAAGTAG TGAGGAGGCT TTTTTCGAGG 
351 CCTAGGCTTT TGCAAAAAGC TGGATCGATC CTGAGAACTT CAGGGTG^GT 
401 TTGGGGACCC TTGATTGTTC TTTCTTTTTC GCTATTGTAA AATTCATGTT 
451 ATATGGAGGG GGCAAAGTTT TCAGGGTGTT GTTTAGMTC GGMGATGTC 
501 CCTTGTATCA CCATGGACCC TCATGATAAT TTTGTTTCTT TCACTTTCTA 
551 CTCTGTTGAC AACCATTGTC TCCTCTTATT TTCTTTTCAT TTTCTCTA AC 
601 TTTTTCGTTA AACTTTAGCT TGCATTTGTA ACGAATTTTT A^TTCACTT 
651 TTGTTTATTT GTCAGATTGT AAGTACTTTC TCTAATCACT TTTTTTTCAA 
701 GGCAATCAGG GTATATTATA TTCTACTTCA GCACAGTTTT AGAGAACAAT 
751 TGTTATAATT AAATGATAAG GTAGAATATT TCTGCATATA AATTCTGGCT 
801 GGCGTGGAAA TATTCTTATT GGTAGAAACA ACTACATCCT GGTCATCATC 
851 CTGCCTTTCT CTTTATGGTT ACAATGATAT ACACTGTTTG AGATGAGGAT 
901 AAAATACTCT GAGTCCAAAC CGGGCCCCTC TCCTAACCAT GTTCATGCCT 
951 TCTTCTTTTT CCTACAGCTC CTCGGCAACG TGCTGGTTAT TGTGCTGTCT 

1 r\/\** EcoRI 

1001 CATCATTTTG GCAAAGAATT GTAATACGAC TCACTATAGG GCGAATTCCA 
1051 CC ATG TCC AAT TTA CTG ACC GTA CAC CAA AAT TIG CCT GCA 

1>M6t Ser Asn LQU Leu Thr Val His Gln Asn Leu Pro Ala 
1092 TTA CCG GTC GAT GCA ACG ACT GAT GAG GTT CGC AAG A*C CTC 

„Ji >^ Pr ° Va ' ASP A ' a Thr S ° r As P Glu Val Af 9 L V S Asn Leu 
1134 ATG GAC ATG TTC AGG GAT CGC CAG GCG TTT TCT GAG CAT ACC 

28^Met Asp Mel Phe A rg Asp A rg Gin Ala Phe Ser Glu His Thr 

1176 TGG AAA ATG CTT CTC TCC GTT TGC CGG TCC TGG GCG GCA TGG 

42^Trp Lys Met Leu Leu Ser Val Cys A rg Ser Trp Ala Ala Trp 
1218 TGC AAG TTC AAT AAC CGG AAA TGG TTT CCC GCA GAA CCT G*A 

56>Cys Lys Leu Asn Asn A rg Lys Trp Phe Pro Ala Glu Pro Glu 
1260 GAT GTT CGC GAT TAT CTT CTA TAT CTT CAG GCG CGC GGT CTC 

70>Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gin Ala A rg Gl y Leu 
1302 GCA GTA AAA ACT ATC CAG CAA CAT TTC GGC CAG CTA AAC ATG 

84>Ala Val Lys Thr I I e Gl n Gl n His Leu Gl y Gin Leu Asn Me. 
1344 CTT CAT CCT CGG TCC GGG CTC CCA CGA CCA ACT G.AC ACC 

98>Leu His Arg Arg Ser Gl y Leu Pro Arg Pro Ser Asp Ser Asn 

138o GCT GTT TCA CTC GTT ATC CGG CGG ATC CGA AAA G^A AAC GTT 

i^o til LSU Va ' M9 ' Arg Ar 9 lle Ar 9 L V S Glu Asn Val 

1428 CAT GCC GGT GAA CGT GCA AAA CAG GCT CTA GCG TTC GAA CGC 

126>Asp Ala Gl y Glu Arg Ala Lys Gin Ala Leu Ala Pho Glu Arg 
1470 ACT GAT TTC GAC CAG GTT CGT TCA CTC ATC GAA AAT AGC CAT 

140>"Thr Asp Phe Asp Gin Val Arg Ser Leu Met Glu Asn Ser Asp 
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1512 CGC TGC CAG GAT ATA CGT AAT CTG GCA TTT CTG GGG ATT GCT 
154^Arg Cys Gin Asp lie A rg Asn Leu Ala Phe Leu Gl y lie Ala 
1554 TAT AAC ACC CTG TTA CGT ATA GCC GAA ATT GCC AGG ATC AGG 
l68>Tyr Asn Thr Leu Leu A rg Me Ala Gl u lie Ala A rg Me A rg 
1596 GTT AAA GAT ATC TCA CGT ACT GAC GCT GGG AGA ATC TTA ATC 
182> Val Lys Asp Me Ser A rg Thr Asp Gl y Gl y A rg Met Leu Me 
1638 CAT ATT GGC AGA ACG AAA ACG CTG GTT AGC ACC GCA GOT GTA 
196^ His Me G! y A rg Thr Lys Thr Leu Val Sor Thr Ala Gl y Val 
1680 GAG AAG GCA CTT AGC CTG GGG GTA ACT AAA CTG CTC GAG CGA 
210>Glu Lys Ala Leu Ser Leu Gl y Val Thr Lys Leu Va! Gl u A rg 
1722 TGG ATT TCC GTC TCT GGT GTA GCT GAT GAT CCG AAT AAC TAC 
224»Trp Me Ser Val Ser Gl y Val Ala Asp Asp Pro Asn Asn Tyr 
1764 CTG TTT TGC CGG GTC AGA AAA AAT GGT GTT GCC GCG CCA TCT 
238> Leu Phe Cys A rg Val A rg Lys Asn Gl y Val Ala Ala Pro Ser 
1806 GCC ACC AGC CAG. CTA TCA ACT CGC GCC CTG GAA GGG ATT TTT 
252> Ala Thr Ser Gin Leu Ser Thr A rg Al a Leu Gl u Gl y Me Phe 
1848 GAA GCA ACT CAT CGA TTG ATT TAC GGC GCT AAG GAT GAC TCT 
266^ Glu Ala Thr His A rg Leu Me Tyr Gl y Ala Lys Asp Asp Ser 
1890 GGT CAG AG} TAC CTG GCC TGG TCT GGA CAC ACT GCC CGT GTC 
280^Gly Gin A rg Tyr Leu Ala Trp Ser Gl y His Ser Ala A rg Val 
1932 GGA GCC GCG CGA GAT ATC GCC CGC GCT GGA GTT TCA ATA CCG 
294>Gly Ala Ala A rg Asp Met Ala A rg Ala Gl y Val Ser Me Pro 
1974 GAG ATC ATC GAA GCT GGT GGC TGG ACC AAT GTA AAT ATT GTC 
308>Glu Me Met Gin Ala Gl y Gl y Trp Thr Asn Val Asn Me Val 

2 ?" ATC MC T AT ATC CGT ^ C CTC GAT ACT GAA ACA GGG GCA ATC 
322»Met Asn i yr Me A rg Asn Leu Asp Ser Gl u Thr Gl y Ala Met 

Xho I 

^LS 1 ? ?* CTC GAT 000 GAT ATr «C CAG GCC 

Y*L Arg Leu Leu G,u As P G'y Asp Leu Glu Me Gin Gin Ala 

™> J? CG^ GTC TCA CAA GAA ACC TCT GAA AAT CCT GGT AAC 

Ill I V G ' n G ' U Thf Ser GIU Asn Pfo G, y Asn 

i£L i ATA GTT CCT ^ ACG ™ C CA CAA CTC ACC CCT ACC 

o?Si ^ " e Pr ° A ' a Thf L6U Pro G,n Leu Thr P '° Thr 

\lU ^ ? 1G ^ GAG G1T A7T CCT GA * CTC TTA TAT 

378>Leu Val Ser Leu Leu Glu Val M e Gl u Pro Glu Val Leu Tyr 

HUT? 2* J AT GAT AGC TCT GTT CCA GAC TCA ACT TGG AGG ATC 

■>lll ~ f V ^ ASP Ser Val Pr0 As P Ser Thr T 'P Arg Me 

22 ^, ATC AGT ACG CTC AAC ATC TTA GGA GGG CGG GAA GTC ATT GCA 

«?n ^ I L6U ASn MB{ LSU G, y G, y Ar 9 Gln V ^l Me Ala 

llntT? ?? P 3°° ^ ^ ATA CCA GGT TTC AGG AA.C TTA 

A ' a LyS A ' a " e Pf ° G, V Phe A '9 Asn Leu 

^ 2 .LT ™ GAT GAC ^ ATS ACC CTA CTC CAG TAC TCC TGG ATC 

Alt ~ ASP A$P G ' n MSt Thf LeU Leu G,n J Y< Sq ' Trp Met 

IIU ^ ^ ATC ^ TTT OT CTC GGG TCG AGA TCA .TAT AGA CAA 

oltl %l ™ A ' a A ' a L9U G 'y Trp Ar 9 Ser T V Arg Gin 

2436 TCA AGT GCA AAC CTC CTG TCT TTT GCT CCT GAT CTC ATT ATT 

462> Ser Ser Ala Asn Leu Leu Cys Phe Ala Pro Asp Lou Me Me 
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2478 AAT GAG CAG AGA ATG ACT CTA CCC TGC ATG TAC GAC CAA TuT 

476>Asn Gl u Gin A rg Met Thr Leu Pro Cys Met Tyr Asp Gin Cys 
2S20 AAA CAC ATG CTG TAT GTT TCC TCT GAG TTA CAC AGG CTT CAG 

490>Lys His Met Leu Tyr Va I Ser Ser Gl u Leu His A rg Leu Gin 
2562 GTA TCT TAT GAA GAG TAT CTC TCT ATG AAA ACC TTA CTG CTT 

504^ Val Ser Tyr Gl u Gl u Tyr Leu Cys Met Lys Thr Leu Leu Leu 
2604 CTC TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC CAA GAG CTA 

5m Leu Ser Ser Val Pro Lys Asp Gl y Leu Lys Ser Gin Gl u Leu 
2646 TTT GAT GAA ATT AGA ATG ACC TAC ATC AAA GAG. CTA GGA AAA 

532>Phe Asp Gl u lie Arg Met Thr Tyr lie Lys Gl u Leu Gl y Lys 
2688 GCC ATT GTC AAG AGG GAA GGA AAC TCC AGC CAG AAC TOG CAG 

546^ Ala lie Val Lys Arg Gl u Gl y Asn Ser Ser Gin Asn Trp Gin 
2730 CGG TTT TAT CAA CTG ACA AAA CTC TTG GAT TCT ATG CAT GAA 

560> Arg Phe Tyr Gin Leu Thr Lys Leu Leu Asp Ser Met His Gl u 
2772 GTG GTT GAA AAT CTC CTT AAC TAT TGC TTC CAA ACA TTT TTG 

574^ Val Val Gl u Asn Leu Leu Asn Tyr Cys Phe Gin Thr Phe Leu 
2814 GAT AAG ACC ATG TCC ACC GAG TTC CCC GAG ATG TTA GCT GAA 

588> Asp Lys Thr Met Ser Thr Gl u Phe Pro Gl u Met Leu Ala Gl u 
2856 ATC ATC ACC AAT CAG ATA CCA AAA TAT TCA AAT GGA AAT ATC 

602Mle He Thr Asn Gin Me Pro Lys Tyr Ser Asn Gly Asn Me 
_ Kpnl 

2898 AAA AAA CTT CTG TTT CAT CAA AAG GGT ACC AGC CGT GGA GGG 

616> Lys Lys Leu Leu Phe His Gin Lys Gly Thr Ser Arg Gly Gly 
2940 GCA TCC GTG GAG CAG ACG GAC CAA AGC CAC TTG GCC ACT GCG 

630> Ala Ser Val Gl u Gl u Thr Asp Gin Ser His Leu Ala Thr Ala 
2982 GCC TCT ACT TCA TCG CAT TCC TTG CAA AAG TAT TAC ATC ACG 

644> Gly Ser Thr Ser, Ser His Ser Leu Gin Lys Tyr Tyr Me Thr 
3024 GGG GAG GCA GAG GGT TTC CCT GCC ACA GTC TGA GAGCTCCCTG 

658> Gly Glu Ala Gl u Gly Phe Pro Ala Thr Val 
EcoRI 

3067 GAATTCGGAT CTTATTAAAG CAGAACTTGT TTATTGCAGC TTATAATGGT 
3117 TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC 
3167 ACTGCATTCT AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG 

Sail 

3217 TCTGGTCGAC TCTAGACTCT TCCGCTTCCT CGCTCACTGA CTCGCTGCGC 
3267 TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT 
3317 ACGGTTATCC ACAGAATCAG GGG ATAACGC AGGAAACAAC ATGTCAGCAA 
3367 AAGGCCAGCA AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT 
3417 TTCCATAGGC TCCGCCCCCC TGACGAGCAT CACAAAAATC GACGCTCAAG 
3467 TCAGAGGTGG CGAAACCCGA CAGCACTATA AAGATACCAG GCGTTTCCCC 
3517 CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC GCTTACCGG ^ 
3567 TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC 
3617 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT 
3667 GTGTGCACGA ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC 
3717 TATCGTCTTG AGTCCAACCC GGTAAGACAC GACTTATCGC CACTGGCAGC 
3767 AGCCACTGGT AACAGGATTA GCAGAGCGAG GTATGTAGGC GGTGCTACAG 
3817 AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG CACAGTATTT 
3867 GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG 
3917 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TT TTTT GTTT 
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3967 GCAAGCAGCA GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG 
4 017 ATCTTTTCTA -CGGGGTCTGA CGCTCAGTGG AACGAAAACT CACGTTAAGG 
4067 GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 
4117 ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA G7AAACTTGG 
4167 TCTGACAGTT ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG 
4217 TCTATTTCGT TCATCCATAG TTGCCTGACT CCCCGTCGTG TAGATAACTA 
4267 CGATACGGGA GGGCTTACCA TCTGGCCCCA GTGCTGCAAT GATACCGCGA 
4317 GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC AGCCAGCCGG 
4367 AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 
4417 CTATTAATTG TTGCCGGGAA GCTAGAGTAA GTAGTTCGCC AGTTAATAGT 
4467 TTGCGCAACG TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC 
4517 GTTTGGTATG GCTTCATTCA GCTCCGGTTC CCAACGATCA AGGCGAGTTA 
4567 CATGATCCCC CATGTTGTGC AAAAAAGCGG TTAGCTCC7T CGGTCCTCCG 
4617 ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA TGGTTATGGC 
4 667 AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 
4717 TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA 
4767 CCGAGTTGCT CTTGCCCGGC GTCAATACGG GATAATACCG CGCCACATAG 
4817 CAGAACTTTA AAAGTGCTCA TCATTGGAAA ACGTTCTTCG GGGCGAAAAC 
4867 TCTCAAGGAT CTTACCGCTG TTGAGATCCA GTTCGATGTA ACCCACTCGT 
4917 GCACCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG TTTCTGGGTG 
4967 AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGCGACAC 
5017 GGAAATGTTG AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT 
5067 TATCAGGGTT ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA 
5117 AAATAAACAA ATAGGGGTTC CGCGCACATT TCCCCGAAAA GTGCCACCTG 
5167 ACGTCTAAGA AACCATTATT A7GATGACAT TAACCTATAA AAATAGGCGT 
5217 ATCACGAGGC CCCTTTCGTC TCGCGCGTTT CGGTGATGAC GGTGAAAACC 
5267 TCTGACACAT GCAGCTCCCG GAGACGGTCA CAGCTTGTCT GTAAGCGGAT 
5317 GCCGGGAGCA GACAAGCCCG TCAGGGCGCG TCAGCGGGTG TTGGCGGGTG 
5367 TCGGGGCTGG CTTAACTATG CGGCATCAGA GCAGATTGTA CTGAGAGTGC 
5417 ACCATATGCG GTGTGAAATA CCGCACAGAT GCGTAAGGAG AAAATACCGC 
5467 ATCAGGAAAT TGTAAACGTT AATATTTTGT TAAAATTCGC GTTAAATTTT 
5517 TGTTAAATCA GCTCATTTTT TAACCAATAG GCCGAAATCG GC AAAATCCC 
5567 TTATAAATCA AAAGAATAGA CCGAGATAGG GTTGAGTGTT GTTCCAGTTT 
5617 GGAACAAGAG TCCACTATTA AAGAACGTGG ACTCCAACGT CAAAGGGCGA 
5667 AAAACCGTCT ATCAGGGCGA TGGCCCACTA CGTGAACCAT CACCCTAATC 
5717 AAGTTTTTTG GGGTCGAGGT GCCGTAAAGC ACTAAATCGG AACCCTAAAG 
5767 GGAGCCCCCG ATTTAGAGCT TGACGGGGAA AGCCGGCGAA CGTGGCGAGA 
5817 AAGGAAGGGA AGAAAGCGAA AGGAGCGGGG GCTAGGGCGC TGGCAAGTGT 
5867 AGCGGTCACG CTGCGCGTAA CCACCACACC CGCCGCGCTT AATGCGCCGC 
5917 TACAGGGCGC GTCGCGCCAT TCGCCATTCA GGCTGCGCAA CTGTTGGGAA 
5967 GGGCGATCGG TGCGGGCCTC TTCGCTATTA CGCCAGCTGG CGAAAGGGGG 
6017 ATGTGCTGCA AGGCGATTAA GTTGGGTAAC GCCAGGGTTT TCCCAGTCAC 
6067 GACGTTGTAA AACGACGGCC AGTGAATT 
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